پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی برق و رباتیک > مقطع کارشناسی ارشد > سال 1391
پدیدآورندگان:
هادی نادری [پدیدآور اصلی]، حسین مروی[استاد راهنما]، امیدرضا معروضی[استاد مشاور]
چکیده: تشخیص کلمات کلیدی یا keyword-spotting در حالت کلی به معنای یافتن یک کلمه ی کلیدی در یک پرونده ی نوشتاری و یا گفتاری است. در این تحقیق، یک روش جدید تشخیص یا بازشناسی کلمات کلیدی در زبان فارسی، در دوحالت پیوسته و گسسته معرفی شده است. در هر دوحالت تشخیص کلمات کلیدی در گفتار پیوسته و گسسته، از روش (Dynamic Time warping(DTW استفاده شده است که با سیستم هایی که بر اساس مدل مخفی مارکوف طراحی شده و امروزه به طور گسترده از آنها استفاده می شود، متفاوت هستند. روش ارائه شده برای تشخیص کلمات کلیدی در حالت پیوسته، بر پایه ی حالت اصلاح شده ای از روش قدیمی Dynamic Time Warping است، که یک روش ابتدایی برای محاسبه ی میزان شباهت دو دنباله ی متغیر با زمان است. در مرحله ی پردازش، سیگنال گفتار به فریم هایی با طول کم تقسیم می شود. هر فریم به صورت یک بردار کوانتیزه شده از ویژگی ها نمایش داده می شود. هم کلمه ی کلیدی و هم گفتار اصلی که جستجو در آن انجام می شود، به صورت دنباله ای یک بعدی از اندیس های کتاب کد تبدیل می شوند. سپس دنباله ی اندیس های گفتار اصلی به چندین جزء تقسیم شده و فاصله ی هرکدام از این بخشها طبق معیار DTW با اندیس های کلمه ی کلیدی بدست می آید. برای هر بخش یک امتیاز اعوجاج محاسبه می شود و بخشی که کمترین امتیاز اعوجاج را داشته باشد، به عنوان محل احتمالی حضور کلمه ی کلیدی معرفی می شود. در روش ارائه شده برای تشخیص کلمات کلیدی در حالت گسسته نیز از روش DTW استفاده شده است. در این حالت، ابتدا از نمونههای مختلف از یک کلمهی کلیدی خاص که توسط یک یا چند گوینده بیان شدهاند و دارای طول متفاوت هستند، بردارهای ویژگی را استخراج کرده و سپس کلمهای که دارای کوچکترین طول است را به عنوان نمونهی مرجع انتخاب میکنیم. سپس با استفاده از روش DTW، مسیر همترازی نمونهی مرجع و سایر نمونهها را بدست آورده و از روی مسیر همترازی، ابعاد ماتریس ویژگی سایر نمونهها را هم بعد با نمونهی مرجع میسازیم. در نهایت از ماتریس ویژگی تمام نمونهها، میانگین میگیریم تا یک نمونهی مرجع عام برای هر کلمهی کلیدی بدست آید. در ادامه از این نمونهی مرجع عام در فرایند تشخیص استفاده میکنیم.
کلید واژه ها (نمایه ها):
#تشخیص کلمات کلیدی #جستجوی صوتی #پردازش گفتار #تشخیص کلمات جدا #مدل مخفی مارکوف #الگوریتم DTW
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده:
پایان نامه های مرتبط (بر اساس کلیدواژه ها)