پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی برق > مقطع کارشناسی ارشد > سال 1400
پدیدآورندگان:
محمد دولتی [پدیدآور اصلی]، حسین مروی[استاد راهنما]
چکیده: با توجه به کاربردهای گسترده سیستم تشخیص گفتار در شرایط محیطی مختلف، مقاومسازی و تقویت عملکرد این سیستمها در برابر انواع نویزها امری ضروری است. یکی از راههای بهبود عملکرد این سیستمها، تقویت روشهای استخراج ویژگی از سیگنالهای گفتار است. اغلب روشهای موجود جهت استخراج ویژگی در پردازش گفتار، ویژگیهای مبتنی بر اندازه را در نظر میگیرند و به دلایل مختلفی از بهکارگیری ویژگی مبتنی بر فاز سیگنال گفتار چشمپوشی میکنند.
هدف اصلی در این پایاننامه استفاده از یک روش جدید استخراج ویژگی مبتنی بر فاز جهت بهبود عملکرد سیستم تشخیص گفتار در شرایط نویزی است. در همین راستا ما در این تحقیق با تغییر در ساختار ضرایب کپسترال نرمالیزه شده توان بهبودیافته (MPNCC) و اضافهکردن تأخیر گروهی بهبودیافته (MGD) به آن، یک روش استخراج ویژگی جدید ارائه کردهایم.
عملکرد روش پیشنهادی به کمک شبکه عصبی پرسپترون چندلایه (MLP) در نرمافزار متلب و با استفاده از پایگاهداده TIIMT جهت تشخیص کلمه در شرایط بدون نویز و نویزی، سنجیده میشود. بهمنظور مقایسه عملکرد روش پیشنهادی از دو ویژگی متداول در حوزه تشخیص گفتار یعنی ضرایب کپسترال فرکانس مل (MFCC) و MPNCC در شرایط یکسان استفاده شده است. نتایج شبیهسازی بیانگر صحت شناسایی بهتر روش پیشنهادی نسبت به روش MPNCC و قابلمقایسه با روش MFCC در شرایط بدون نویز است. در شرایط نویزی در SNRهای مختلف صحت روش پیشنهادی بهتر از دو روش MFCC و MPNCC بوده است. بهعنوانمثال صحت روش پیشنهادی در نویز سفید گوسی در SNR 5- دسیبل 8/14 و 7/9 درصد به ترتیب نسبت به روشهای MFCC و MPNCC بهبود داشته است.
کلید واژه ها (نمایه ها):
#بازشناسی گفتار #استخراج ویژگی #مقاومسازی #فاز #تأخیر گروهی #ضرایب کپسترال
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده: