پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی برق و رباتیک > مقطع کارشناسی ارشد > سال 1392
پدیدآورندگان:
دانیال دارابیان [پدیدآور اصلی]، حسین مروی[استاد راهنما]، حسین خسروی[استاد مشاور]
چکیده: بازشناخت اتوماتیک گفتار در واقع مساله تشخیص گفتار برای یک نمونه گفتار صحبت شده توسط سخنگوی نامعلوم است. هر سیستم اتوماتیک تشخیص گفتار نیازمند استخراج ویژگی است که به وسیله- ی ویژگی استخراج شده بتواند گفتار ورودی را متمایز نماید و سپس تشخیص دهد از این دسته ویژگی ها می توان به ضرایب مل-کپستروم اشاره نمود که بعدها به یکی از فراگیرترین ویژگی های مورد استفاده در پردازش گفتار تبدیل شدند. مشکل عمده در استفاده از این ضرایب زمانی ظاهر می شود که تشخیص گفتار در محیط های همراه با نویز صورت بپذیرد. عملکرد این الگوریتم در حضور نویز، با سرعت زیاد و به شدت کاهش می یابد. برای دست یابی به یک عملکرد رضایت بخش تحت شرایط نویزی در سیستم های تشخیص گفتار نیاز به مصون سازی این الگوریتم در برابر نویز می باشد. در این پایان نامه یک روش مقاوم در برابر نویز، جهت استخراج ویژگی ضرایب مل-کپستروم معرفی شده است. ویژگی های استخراج شده از سیگنال گفتار را به وسیله ی یک شبکه عصبی طبقه بندی می کنیم. در این پایان نامه از یک شبکه عصبی پرسپترون با یک لایه ورودی، دو لایه میانی یا مخفی و یک لایه خروجی جهت کلاسه بندی نتایج استفاده شده است. جهت ارزیابی الگوریتم پیشنهادی تعداد 40 لغت متفاوت، در هر لغت 20 تکرار توسط 20 گوینده ی متفاوت شامل زن و مرد بزرگسال از نمونه های صوتی پایگاه اطلاعاتی FARS-DATاستفاده شده است. تاکنون روش های مختلفی در مصون سازی این الگوریتم به کار رفته است که هر یک به یک بلوک خاص پرداخته اند و یا بلوکی مکمل به الگوریتم پایه افزوده اند در حالی که در روش پیشنهادی علاوه بر در نظر گرفتن اکثر تغییرات مهم اعمال شده در سایر الگوریتم ها، هر یک را در مکان مناسب استفاده و نیز با روش های مناسب ترکیب کرده ایم و نیز بلوک هایی به الگوریتم پایه افزوده ایم. نتایج آزمایش های تشخیص گفتار فارسی در نرخ سیگنال به نویزهای متفاوت، نشان گر افزایش معنادار نرخ تشخیص و نیز مصونیت بیشتر الگوریتم پیشنهادی نسبت به الگوریتم پایه و همچنین برخی از الگوریتم های مطرح در این خانواده همچون الگوریتم های : AMFCC، GMFCC، ROOT-MFCC،CMN-SMN-MFCC و نیز RAS-MFCC است.
کلید واژه ها (نمایه ها):
#بازشناخت گفتار #ضرایب مل #کپستروم #تابع خود همبستگی #فیلتربانک گوسی #تفریق میانگین گفتار #جبرانگر لگاریتم
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده:
پایان نامه های مرتبط (بر اساس کلیدواژه ها)