پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی کامپیوتر > مقطع دکتری > سال 1396
پدیدآورندگان:
مراد درخشان [پدیدآور اصلی]، حسین مروی[استاد راهنما]، حمید حسن پور[استاد مشاور]
چکیده: تشخیص و رده‌بندی وقایع صوتی در محیط کار و زندگی به صورت یک نیاز در دنیای مدرن قرن 21 تبدیل شده‌است، به‌نحوی که شاخه‌ای از پژوهش در هوش مصنوعی و به تبع آن در زیرشاخه محاسبات آنالیز صحنه شنیداری از حوزه پردازش سیگنال دیجیتال به این کار اختصاص یافته‌است. این رساله، دو پیشنهاد مهم در خصوص کشف و رده‌بندی صداهای محیطی ارائه می‌کند. در راهکار اول یک مدل با چندین جزء مستقل کوچک‌تر پیشنهاد می‌شود که هرکدام دارای نقطه قوتی برای کل مدل است. بیش‌ترِ مدل‌های موجود، همه انتظارات از مدل‌سازی را در یک تعریفِ منسجم و آماری می‌بینند، اما در اینجا، مدل اصلی از ترکیب موازی چند جزء ساخته می‌شود تا بتواند حداکثر اطلاعات را از داده‌های خام استخراج و آن‌ها را به‌نحو مطلوب مدل کند و به‌علاوه بین اجزاء، به‌خصوص ویژگی‌ها، تاثیر جانبی مثبت را جایگزین تاثیر جانبی منفی نماید. معیار F1 در این روش برای شناسایی فریم و واقعه صوتی به ‌ترتیب 80.6 درصد و 72.8 درصد بدست آمده‌است. راهکار دوم مبتنی بر تجزیه نامنفی سیگنال مشاهده جهت ذخیره بافت فرکانسی نمونه از صداها به صورت اتم‌ها یا وصله‌های‌صوتی در یک دیکشنری و سپس بازسازی سیگنال آزمایش از طریق تولید یک نمایش تنک از اتم‌های دیکشنری در بازنمایی سگمنت‌های آن سیگنال است. این روش در واقع مبتنی بر جداسازی و تفکیک یک سیگنال به اجزای اولیه یعنی وقایع صوتی است. معیار F1 در این روش برای شناسایی فریم و واقعه صوتی به ‌ترتیب 56.5 درصد و 49.2 درصد ‌بدست آمده‌است. این نتایج برتری روش‌های پیشنهادی نسبت به روش‌های پیشین بر روی پایگاه داده DCASE2013 را نشان می‌دهد.
کلید واژه ها (نمایه ها):
#شناسایی و رده‌بندی وقایع صوتی #سگمنت‌بندی #استخراج ویژگی #جداسازی منابع صوت #تجزیه نامنفی ماتریس #نمایش تنک سیگنال #آنالیز صحنه‌های شنیداری #الگوریتم‌های یادگیری ماشینی #اسپکتروگرام #نظارت و دیده‌بانی صوتی

دانلود نسخه تمام متن (رایگان)

محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده:
پایان نامه های مرتبط (بر اساس کلیدواژه ها)