پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی برق و رباتیک > مقطع کارشناسی ارشد > سال 1394
پدیدآورندگان:
محمدرضا حقیقت [پدیدآور اصلی]، هادی گرایلو[استاد راهنما]
چکیده: در این پایان نامه، دادگان جدیدی با استفاده از دایفون ها برای سیستم سنتز گفتار پیشنهاد داده ایم. دایفون ها چند مزیت بزرگ نسبت به سایر واحدهای گفتار دارند. یکی این است که تعداد آن ها کم است و دیگر این که دایفون ها گذر از یک دایفون به دایفون بعدی را نسبت به واحدهای دیگر گفتار، بهتر نشان می دهند. در این تحقیق می خواهیم حالت های مختلف جملات را در خروجی سیستم سنتز گفتار تولید کنیم. در بیشتر روش های استفاده شده در زبان فارسی، برای طبیعی سازی گفتار مصنوعی از مدل های آماری و ریاضی مانند مدل مخفی مارکوف، درخت های تصمیم گیری، شبکه های عصبی و ... استفاده شده است که به کارگیری آن ها بسیار پیچیده می باشد. در این پایان نامه نشان داده می شود که می توان با در دست داشتن حالت های مختلف دایفونی گفتار سنتز شده ی خروجی را با حالت های مختلف گفتاری، تولید، و آن را به گفتار طبیعی انسان نزدیک تر کرد. دادگان دایفونی پیشنهاد شده، شامل هفت حالت مختلف دایفونی است که هر کدام دارای ویژگی منحصر به فردی می باشد. در بخش شبیه سازی، ابتدا با استفاده از دایفون های استخراجی از جملات ضبط شده و چسباندن دایفون های مورد نیاز در کنار هم، جملات هدف را تولید کردیم. جملات به دست آمده از این روش را برای شنوندگان پخش نمودیم و ایشان طبق معیار MOS نمره ای برای پارامترهایی مانند قابلیت فهم و طبیعی بودن گفتار لحاظ کردند. مقایسه نتایج بدست آمده با نتایج مقالات دیگر که طبق معیار MOS روش خود را ارزیابی کرده اند نشان میدهد که روش پیشنهادی از نظر قابلیت فهم امتیاز بیشتری نسبت به روش استفاده از درخت تصمیم گیری و روش استفاده از ترایفون کسب نموده است. همچنین راه کارهایی برای ارتقای کیفیت روان بودن و طبیعی بودن گفتار خروجی، وجود دارد که در پایان نامه به شرح آن ها پرداخته ایم.
کلید واژه ها (نمایه ها):
#سیستم تبدیل متن به گفتار #سیستم سنتز گفتار #دایفون #طبیعی سازی گفتار مصنوعی #معیار MOS
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده:
پایان نامه های مرتبط (بر اساس کلیدواژه ها)