پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی برق و رباتیک > مقطع کارشناسی ارشد > سال 1390
پدیدآورندگان:
جلیل قاسمی [پدیدآور اصلی]، حسین مروی[استاد راهنما]، امیدرضا معروضی[استاد مشاور]
چکیده: با پیشرفت روز افزون علم و تکنولوژی نیاز بشر به سیستم های هوشمند در تمامی زمینه ها مشهود می باشد. با توجه به اینکه صدای هر فرد مانند شناسه های دیگری چون اثر انگشت، خصوصیات چهره، عنبیه چشم و ... منحصر به فرد می باشد به همین دلیل از آن در سیستم های هوشمند بازشناسی گوینده استفاده می شود. اما یکی از مهمترین مسائل مطرح شده در زمینه سیستم های بازشناسی گوینده تأثیر نویز بر سیگنال گوینده و کاهش دقت بازشناسی است. لذا بازشناسی مقاوم گوینده در مقابل نویز یکی از موارد مورد مطالعه محققان می باشد که در سالهای اخیر تحقیقات زیادی در این زمینه انجام شده و روشهای مختلفی ارایه شده است. هدف از انجام این تحقیق استفاده از توزیع زمان- فرکانس ویگنر- ویل برای استخراج ویژگی از سیگنال گفتار می باشد. در این تحقیق از ترکیب تابع توزیع ویگنر- ویل و تبدیل هیلبرت و ضرایب MFCC برای استخراج ویژگی استفاده شده است. در این روش از سیگنال گفتار تبدیل هیلبرت گرفته شده و پس از آن، تبدیل ویگنر- ویل گرفته می شود. سیگنال خروجی از تبدیل ویگنر- ویل از فیلتر بانک مل عبور داده می شود و پس از لگاریتم گیری، از آن تبدیل فوریه کسینوسی گرفته می شود. خروجی بدست آمده از این سیستم پیشنهادی بعنوان یک ویژگی استخراج شده از سیگنال گفتار جهت تشخیص گوینده بکار می رود. به کمک این ویژگی ها برای هر گوینده یک مدل مخلوط گوسی(GMM) بدست آورده شده است. نتایج حاصله در این روش با ضرایب MFCC و PLP مقایسه شده است که جهت پیاده سازی روش های پیشنهادی از دیتا بیس TIMIT استفاده شده است. نتایج گویای این مطلب است که روش پیشنهادی در سیگنال به نویزهای پایین جواب بهتری را از ضرایب MFCC و PLP ارایه می دهد.
کلید واژه ها (نمایه ها):
#بازشناسی گوینده و گفتار #توزیع ویگنر- ویل #استخراج ویژگی
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده:
پایان نامه های مرتبط (بر اساس کلیدواژه ها)