پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی برق > مقطع کارشناسی ارشد > سال 1399
پدیدآورندگان:
رضا اباذری [پدیدآور اصلی]، حسین مروی[استاد راهنما]
چکیده: وجود نویز در محیط طبیعی زندگی اجتناب ناپذیر بوده و موجب تخریب سیگنال های گفتاری و در نتیجه کاهش صحت بازشناسی گفتار که از مباحث بنیادی در زمینه پردازش گفتار است، می شود. مقاوم سازی سیستم های بازشناسی گفتار در برابر انواع نویز باتوجهبه کاربرد فراوان در شرایط محیطی مختلف، اهمیت بسیاری دارد. اولین و اصلی ترین بخش این سیستم ها، فرایند استخراج ویژگی است که در سال های اخیر الگوریتم های بسیاری در این زمینه برای کاهش اثر نویز، معرفی شده است.
در این پژوهش سه روش استخراج ویژگی جدید BFMHECC، HEBFCC1 و HEBFCC2، بر مبنای میانگین ضرایب پوش تبدیل هیلبرت و ضرایب کپسترال فیلتر بانک بارک که از سیستم شنوایی انسان الهام می گیرند، به منظور مقاوم سازی سیستم های بازشناسی گفتار معرفی می شوند. کارایی ضرایب ویژگی استخراج-شده از روش های استخراج ویژگی پیشنهادی، با کمک شبکه عصبی پرسپترون چندلایه MLP برای کار تشخیص گفتار با استفاده از پایگاه داده TI_DIGIT در سیگنال های گفتاری نویزی و بدون نویز برآورد شده و در شرایط یکسان با سایر روش های پرکاربرد در این زمینه، مقایسه می شود.
مقایسه نتایج این روش ها مبیّن عملکرد کم وبیش بهتر روش های پیشنهادی، در سیگنال های گفتاری نویزی و بدون نویز نسبت به روش های متداول است. از سه روش پیشنهادی، روش BFMHECC کارایی بهتری را نسبت به دو روش دیگر، براثر نویزهای مختلف با مقادیر SNR های 5- ،0، 5 و 10 و بر اساس معیارهای ارزیابی صحت و EER ارائه می دهد.
کلید واژه ها (نمایه ها):
#سیگنال گفتاری نویزی #استخراج ویژگی #پوش تبدیل هیلبرت #فیلتر بانک بارک
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده: