پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی برق > مقطع کارشناسی ارشد > سال 1400
پدیدآورندگان:
محمد دولتی [پدیدآور اصلی]، حسین مروی[استاد راهنما]
چکیده: با توجه به کاربردهای گسترده سیستم تشخیص گفتار در شرایط محیطی مختلف، مقاوم‌سازی و تقویت عملکرد این سیستم‌ها در برابر انواع نویزها امری ضروری است. یکی از راه‌های بهبود عملکرد این سیستم‌ها، تقویت روش‌های استخراج ویژگی از سیگنال‌های گفتار است. اغلب روش‌های موجود جهت استخراج ویژگی در پردازش گفتار، ویژگی‌های مبتنی بر اندازه را در نظر می‌گیرند و به دلایل مختلفی از به‌کارگیری ویژگی مبتنی بر فاز سیگنال گفتار چشم‌پوشی می‌کنند. هدف اصلی در این پایان‌نامه استفاده از یک روش جدید استخراج ویژگی مبتنی بر فاز جهت بهبود عملکرد سیستم تشخیص گفتار در شرایط نویزی است. در همین راستا ما در این تحقیق با تغییر در ساختار ضرایب کپسترال نرمالیزه شده توان بهبودیافته (MPNCC) و اضافه‌کردن تأخیر گروهی بهبودیافته (MGD) به آن، یک روش استخراج ویژگی جدید ارائه کرده‌ایم. عملکرد روش پیشنهادی به کمک شبکه عصبی پرسپترون چندلایه (MLP) در نرم‌افزار متلب و با استفاده از پایگاه‌داده TIIMT جهت تشخیص کلمه در شرایط بدون نویز و نویزی، سنجیده می‌شود. به‌منظور مقایسه عملکرد روش پیشنهادی از دو ویژگی متداول در حوزه تشخیص گفتار یعنی ضرایب کپسترال فرکانس مل (MFCC) و MPNCC در شرایط یکسان استفاده شده است. نتایج شبیه‌سازی بیانگر صحت شناسایی بهتر روش پیشنهادی نسبت به روش MPNCC و قابل‌مقایسه با روش MFCC در شرایط بدون نویز است. در شرایط نویزی در SNRهای مختلف صحت روش پیشنهادی بهتر از دو روش MFCC و MPNCC بوده است. به‌عنوان‌مثال صحت روش پیشنهادی در نویز سفید گوسی در SNR 5- دسی‌بل 8/14 و 7/9 درصد به ترتیب نسبت به روش‌های MFCC و MPNCC بهبود داشته است.
کلید واژه ها (نمایه ها):
#باز‌شناسی گفتار #استخراج ویژگی #مقاوم‌سازی #فاز #تأخیر گروهی #ضرایب کپسترال
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده:
پایان نامه های مرتبط (بر اساس کلیدواژه ها)