پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی برق و رباتیک > مقطع کارشناسی ارشد > سال 1395
پدیدآورندگان:
رعنا دهقانی [پدیدآور اصلی]، حسین مروی[استاد راهنما]
چکیده: یکی از مباحث مهم در زمینه ارتباطات و مخابرات، جداسازی گفتار توسط ماشین می باشد که به دلیل مشکلات و ضعف های موجود در این سیستم، کماکان به عنوان یک چالش بزرگ باقی مانده است. این در حالی است که سیستم شنیداری انسان در مقایسه با سیستم جداسازی گفتار ماشین توانایی های قابل توجهی دارد. لذا با توجه به اختلاف در عملکرد سیستم جداسازی گفتار توسط ماشین و سیستم شنیداری انسان، نیاز به یک سیستم کارآمد برای جداسازی گفتار مورد نظر توسط ماشین در بسیاری از کاربردها محسوس می باشد. به عنوان مثال یکی از معایب سیستم تشخیص خودکار گفتار، کاهش عملکرد آن در صورت وجود صداهای مزاحم است. بنابراین چنین سیستمی می بایست به یک جداکننده گفتار خوب مجهز شود تا ضمن بهبود عملکرد آن در شرایط مختلف، در بهبود کیفیت گفتار و کاهش هزینه انتقال سیگنال غیرگفتار نیز نقش موثری داشته باشد. از آن جا که انتخاب دقیق واحدهای زمان-فرکانس تاثیر به سزایی در نتایج جداسازی دارد، در این پایان نامه یک روش با نظارت به منظور انتخاب واحدهای زمان-فرکانس مناسب بر پایه ویژگی های ضرایب تٌنٌک ارائه می شود. در روش پیشنهادی ابتدا نمونه ی صدای گوینده ها مدل سازی شده که این مدل سازی از طریق آموزش یک دیکشنری و به دست آوردن بردارهای پایه مربوط به هر کدام از گوینده ها انجام می گیرد. بعد از مدل سازی صدای هر یک از دو گوینده ی همزمان، برای هر صدا مطابق با مولفه های فرکانسی مربوط به آن عمل جداسازی انجام شده و به منظور کاهش نویز صدای خروجی و حذف مولفه های فرکانسی نامرتبط، یک مرحله ی پس پردازش نیز روی صدای خروجی انجام می شود. نتایج آزمایش های انجام شده با هدف جداسازی دو گوینده همزمان، نشان دهنده عملکرد قابل توجه روش پیشنهادی در مقایسه با روش های مبتنی بر ویژگی و مدل می باشد.
کلید واژه ها (نمایه ها):
#آنالیز ترکیب شنیداری محاسباتی #جداسازی گفتار دو گوینده همزمان #جداسازی با نظارت
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده:
پایان نامه های مرتبط (بر اساس کلیدواژه ها)