پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی برق > مقطع دکتری > سال 1404
پدیدآورندگان:
علیرضا توکلی [پدیدآور اصلی]، حسین مروی[استاد راهنما]
چکیده: ﭼﮑﯿﺪه با توسعه فناوری و پیشرفت‌های تکنولوژیکی فناوری تشخیص گفتار به دلیل اینکه سیگنال گفتار شامل انواع مختلفی از اطلاعات است، به یکی از محورهای اصلی تحقیقات در سال‌های اخیر تبدیل شده است. تشخیص و تصدیق هویت گوینده دو شاخه مهم از حوزه پردازش گفتار به شمار می‌روند. برای تأیید هویت یک گوینده موانع و چالش‌های متعددی مانند: نویز، تغییرات کانال، تأثیر عوامل جانبی و گفتارهای با طول کوتاه وجود دارد که می‌توانند در روند اجرای این فرآیند اختلال ایجاد کنند. به‌طور معمول کارایی و بازده سیستم‌های تصدیق هویت گوینده در شرایط نویزی به‌طور قابل توجهی کاهش می‌یابد. یکی از روش های پرکاربرد برای سیستم های تصدیق هویت گوینده استفاده از بردارهای هویت می باشد. طبق یافته‌های پژوهش‌های پیشین بردارهای هویت معمولاً حاوی اطلاعات غیرهویتی نیز هستند که بر عملکرد سیستم‌های تصدیق هویت تأثیر منفی می‌گذارند. لذا بهره‌گیری از تبدیلات زمان–فرکانس می‌تواند به کاهش این تأثیرات منجر شده و صحت سیستم‌های تصدیق هویت گوینده را افزایش دهد. هدف این رساله ارائه روش‌هایی برای استخراج بردار هویت مبتنی بر تبدیلات زمان–فرکانس است؛ به‌گونه‌ای که تأثیر اطلاعات غیرهویتی به‌ویژه نویز و ویژگی‌های کانال‌های ارتباطی کاهش یافته و امکان تصدیق هویت گوینده در محیط‌های نویزی فراهم شود. در این پژوهش شناسایی گوینده مقاوم در برابر نارسایی‌های سخت‌افزاری و نویز پیاده‌سازی شده است. به‌منظور افزایش صحت شناسایی ویژگی‌های گفتار با استفاده از روش‌های متنوعی از جمله ویگنرویل، تبدیل موجک گسسته و گابور استخراج شدند. سپس مدل مخلوط گوسی جهت مدل‌سازی ویژگی‌های گویندگان مورد استفاده قرار گرفته است. برای افزایش صحت و پایداری مرحله نرمال‌سازی و استخراج بردار هویت به سیستم افزوده شده است. مدل نهایی با استفاده از روش‌های آماری نظیر تخمین پارامترهای مدل و مقایسه‌کننده نهایی ارزیابی گردیده است. ارزیابی سیستم تصدیق هویت گوینده بر اساس میزان خطا در آزمون‌ها و با ترسیم منحنی های نرخ پذیرش اشتباه، نرخ رد اشتباه و نرخ خطای برابر انجام شده است. آزمایش های انجام شده برروی پایگاه داده TIMIT نشان می دهند که روش های پیشنهادی در برابر نویز و نارسایی های سخت‌افزاری نسبت به روش های متداول عملکرد بهتری دارد.
کلید واژه ها (نمایه ها):
#کلیدواژه‌ها: تصدیق هویت گوینده #اطلاعات غیرهویتی #بردار هویت #تبدیلات زمان–فرکانس
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده:
پایان نامه های مرتبط (بر اساس کلیدواژه ها)