پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی برق و رباتیک > مقطع کارشناسی ارشد > سال 1389
پدیدآورندگان:
زینب محمدپوری [پدیدآور اصلی]، حسین مروی[استاد راهنما]، امیدرضا معروضی[استاد راهنما]، سید علی سلیمانی ایوری[استاد مشاور]
چکیده: بهسازی گفتار یا Speech enhancement بیانگر گروه بزرگی از روش هاست که با انجام پردازش هایی روی سیگنال های نویزی، نهایتا منجر به بهبود کیفیت و قابلیت فهم گفتار می شود. از مهم ترین روش های بهسازی گفتار، روش های آماری هستند که به لحاظ کارایی بالاتر نسبت به سایر روش ها و ایجاد اعوجاج کمتر در سیگنال نهایی بیشتر مورد توجه می باشد. در این روش یک مدل آماری برای گفتار و نویز فرض می شود و پردازش ها بر مبنای این مدل صورت می گیرد. این مدل آماری برای ضرایب فوریه یا پارامترهای دیگر هر قاب سیگنال گفتار یا نویز فرض می شود. در این پایان نامه، روش آماری جدیدی برای تخمین سیگنال تمیز از روی سیگنال نویزی در حضور نویز جمع شونده و مستقل از سیگنال تمیز، در حوزه فرکانس ارائه شده است. تا کنون از مدل های گوسی، لاپلاس، گاما و مخلوط گوسی ، برای مدل کردن طیف سیگنال گفتار استفاده شده؛ اما در این پایان نامه، توزیع مخلوط لاپلاس برای مدل کردن بخش های حقیقی و موهومی طیف گفتار پیشنهاد شده است. پارامترهای این مدل (میانگین ها، واریانس ها و ضرایب) به صورت برون خطی و با استفاده از الگوریتم EM و سیگنال صحبت بدون نویز از پایگاه داده TIMIT محاسبه شده است. سپس رابطه تخمین گرMMSE یا کمترین میانگین مربعات خطا، با توجه به توزیع مخلوط لاپلاس به دست آورده شده است. واریانس نویز به صورت درون خطی و با استفاده از روش ردیابی کمینه ها به دست آمده است. در نهایت برای ارزیابی و عملکرد روش پیشنهادی از سه معیار سیگنال به نویز قطعه ای،PESQ و Log Likellihood Ratio (LLR) استفاده شده؛ و روش پیشنهادی با روشهایی که مدل گوسی و لاپلاس را برای سیگنال تمیز فرض کرده اند، مقایسه شده است. بررسی نتایج بیانگر عملکرد قابل قبول روش پیشنهادی است.
کلید واژه ها (نمایه ها):
#بهسازی گفتار #توزیع مخلوط لاپلاس #EM الگوریتم #تخمین گر MMSE #آمارگان کمینه
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده:
پایان نامه های مرتبط (بر اساس کلیدواژه ها)