پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی برق > مقطع کارشناسی ارشد > سال 1387
پدیدآورندگان:
علی عباسیان [پدیدآور اصلی]، حسین مروی[استاد راهنما]، سید علی سلیمانی ایوری[استاد مشاور]
چکیده: فرآیندبازشناسی گفتار شامل سه مرحله اصلی پیش پردازش، استخراج ویژگی و کلاسه بندی می باشد که استخراج ویژگی از سیگنال صحبت، مهمترین مرحله است. دنباله ویژگی در روشهای معمول استخراج ویژگی مانند ضرایب کپسترال فرکانسی مل (MFCC) و روش پیشگویی خطی ادراکی(PLP) از طیف دامنه سیگنال استخراج می شود و طیف فاز حذف می گردد. زیرا بر این باورند که طیف فاز، اطلاعات کمی راجع به سیگنال صحبت دارد. در سالهای اخیر تحقیقاتی در زمینه استخراج ویژگی از طیف فاز، جهت باز شناسی گفتار انجام شده است. در اغلب این موارد مطالعات بر مبنای تابع گروه تاخیر فاز بوده است. تابع گروه تاخیر فاز دارای خواص شبیه طیف فاز می باشد. البته در سالهای پیشین، تابع گروه تاخیر فاز در زمینه های دیگر مانند استخراج فرکانس اصلی سیگنال صحبت و بازسازی سیگنال و تخمین طیف سیگنال استفاده می شده است. در این پایان نامه در ابتدا، دو روش معمول استخراج ویژگی PLP، MFCC، مورد بررسی قرار می گیرد. سپس طیف فاز و تابع گروه تاخیر فاز و همچنین نحوه محاسبه مستقیم تابع گروه تاخیر فاز از خود سیگنال صحبت تشریح می گردد. در ادامه الگوریتمی جدید با استفاده از تابع گروه تاخیر فاز جهت بازشناسی گفتار ارائه می گردد. نتایج بازشناسی توسط الگوریتم پیشنهادی، مطلوبتر از روش PLP می باشد. ولی با این وجود روش MFCC نتایج بهتری دارد. با توجه به نتایج حاصل شده از این پایان نامه، ترکیب ویژگی های دامنه و فاز سیگنال صحبت می تواند در بازشناسی گفتار مفید واقع شود.
کلید واژه ها (نمایه ها):
#بازشناسی گفتار #استخراج ویژگی #تابع گروه تاخیر فاز دانلود نسخه تمام متن (رایگان)
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرودیادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده: