پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی برق > مقطع دکتری > سال 1404
پدیدآورندگان:
علیرضا توکلی [پدیدآور اصلی]، حسین مروی[استاد راهنما]
چکیده: ﭼﮑﯿﺪه
با توسعه فناوری و پیشرفتهای تکنولوژیکی فناوری تشخیص گفتار به دلیل اینکه سیگنال گفتار شامل انواع مختلفی از اطلاعات است، به یکی از محورهای اصلی تحقیقات در سالهای اخیر تبدیل شده است. تشخیص و تصدیق هویت گوینده دو شاخه مهم از حوزه پردازش گفتار به شمار میروند. برای تأیید هویت یک گوینده موانع و چالشهای متعددی مانند: نویز، تغییرات کانال، تأثیر عوامل جانبی و گفتارهای با طول کوتاه وجود دارد که میتوانند در روند اجرای این فرآیند اختلال ایجاد کنند. بهطور معمول کارایی و بازده سیستمهای تصدیق هویت گوینده در شرایط نویزی بهطور قابل توجهی کاهش مییابد.
یکی از روش های پرکاربرد برای سیستم های تصدیق هویت گوینده استفاده از بردارهای هویت می باشد. طبق یافتههای پژوهشهای پیشین بردارهای هویت معمولاً حاوی اطلاعات غیرهویتی نیز هستند که بر عملکرد سیستمهای تصدیق هویت تأثیر منفی میگذارند. لذا بهرهگیری از تبدیلات زمان–فرکانس میتواند به کاهش این تأثیرات منجر شده و صحت سیستمهای تصدیق هویت گوینده را افزایش دهد.
هدف این رساله ارائه روشهایی برای استخراج بردار هویت مبتنی بر تبدیلات زمان–فرکانس است؛ بهگونهای که تأثیر اطلاعات غیرهویتی بهویژه نویز و ویژگیهای کانالهای ارتباطی کاهش یافته و امکان تصدیق هویت گوینده در محیطهای نویزی فراهم شود. در این پژوهش شناسایی گوینده مقاوم در برابر نارساییهای سختافزاری و نویز پیادهسازی شده است. بهمنظور افزایش صحت شناسایی ویژگیهای گفتار با استفاده از روشهای متنوعی از جمله ویگنرویل، تبدیل موجک گسسته و گابور استخراج شدند. سپس مدل مخلوط گوسی جهت مدلسازی ویژگیهای گویندگان مورد استفاده قرار گرفته است. برای افزایش صحت و پایداری مرحله نرمالسازی و استخراج بردار هویت به سیستم افزوده شده است. مدل نهایی با استفاده از روشهای آماری نظیر تخمین پارامترهای مدل و مقایسهکننده نهایی ارزیابی گردیده است.
ارزیابی سیستم تصدیق هویت گوینده بر اساس میزان خطا در آزمونها و با ترسیم منحنی های نرخ پذیرش اشتباه، نرخ رد اشتباه و نرخ خطای برابر انجام شده است. آزمایش های انجام شده برروی پایگاه داده TIMIT نشان می دهند که روش های پیشنهادی در برابر نویز و نارسایی های سختافزاری نسبت به روش های متداول عملکرد بهتری دارد.
کلید واژه ها (نمایه ها):
#کلیدواژهها: تصدیق هویت گوینده #اطلاعات غیرهویتی #بردار هویت #تبدیلات زمان–فرکانس
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده: