پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی برق > مقطع کارشناسی ارشد > سال 1393
پدیدآورندگان:
محمد سلیمان پور [پدیدآور اصلی]، حسین مروی[استاد راهنما]
چکیده: شناسایی گوینده یکی از موضوع های مورد علاقه محققان در زمینه پردازش گفتار و هوش مصنوعی در چند دهه گذشته می باشد. در سالیان متوالی، تلاش های فراوانی در قسمت های مختلف این نوع سیستم ها برای بهبود کارایی آن شده است. یکی از این قسمت ها که می تواند باعث بهبود سیستم های شناسایی گوینده شود، قسمت انتخاب ویژگی می باشد. معمولاً برای برگزیدن ویژگی-های مطلوب تر که باعث بهبود عملکرد سیستم می شود، بعد از مرحله استخراج ویژگی از انتخاب ویژگی استفاده می کنند. برای انجام این کار، روش ها و ابزارهای مختلفی وجود دارد که در این پایان نامه از خوشه بندی برای یافتن بردارهای ویژگی که بیشترین تشابه را دارند استفاده شده است و در نتیجه این بردارهای مشابه، بیشترین خصوصیات مربوط به مجرای صوتی فرد را مشخص می کند. این کار باعث همگرایی بیشتر برای ساخت مدل هر فرد و یا مرزهای تصمیم گیری بین افراد می-شود. در این پایان نامه دو روش پیشنهاد شده است که در هر دو روش از الگوریتم رقابت استعماری جهت خوشه بندی بردارهای ویژگی استفاده شده است و همچنین دو الگوریتم دیگر خوشه بندی K-Means و خوشه بندی PSO برای مقایسه کارایی الگوریتم رقابت استعماری بکار گرفته شده است. در نهایت، نتایج دو روش پیشنهادی را با دو روش SVM و ELM بهینه سازی شده را از نظر نرخ بازشناسی و مدت زمان استفاده شده از داده گان مقایسه کرده ایم. بررسی نتایج نشان می دهد که نرخ بازشناسی در روش های پیشنهادی بهبود یافته است. در این پروژه ما از داده گان ELSDSR استفاده کرده ایم. به دلیل ماهیت داده گان موجود، در این پایان نامه یک سیستم شناسایی گوینده مستقل از متن خواهیم داشت.
کلید واژه ها (نمایه ها):
#شناسایی گوینده #MFCC #انتخاب ویژگی #الگوریتم رقابت استعماری #خوشه بندی

دانلود نسخه تمام متن (رایگان)

محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده:
پایان نامه های مرتبط (بر اساس کلیدواژه ها)