پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی کامپیوتر > مقطع دکتری > سال 1396
پدیدآورندگان:
مراد درخشان [پدیدآور اصلی]، حسین مروی[استاد راهنما]، حمید حسن پور[استاد مشاور]
چکیده: تشخیص و ردهبندی وقایع صوتی در محیط کار و زندگی به صورت یک نیاز در دنیای مدرن قرن 21 تبدیل شدهاست، بهنحوی که شاخهای از پژوهش در هوش مصنوعی و به تبع آن در زیرشاخه محاسبات آنالیز صحنه شنیداری از حوزه پردازش سیگنال دیجیتال به این کار اختصاص یافتهاست.
این رساله، دو پیشنهاد مهم در خصوص کشف و ردهبندی صداهای محیطی ارائه میکند. در راهکار اول یک مدل با چندین جزء مستقل کوچکتر پیشنهاد میشود که هرکدام دارای نقطه قوتی برای کل مدل است. بیشترِ مدلهای موجود، همه انتظارات از مدلسازی را در یک تعریفِ منسجم و آماری میبینند، اما در اینجا، مدل اصلی از ترکیب موازی چند جزء ساخته میشود تا بتواند حداکثر اطلاعات را از دادههای خام استخراج و آنها را بهنحو مطلوب مدل کند و بهعلاوه بین اجزاء، بهخصوص ویژگیها، تاثیر جانبی مثبت را جایگزین تاثیر جانبی منفی نماید. معیار F1 در این روش برای شناسایی فریم و واقعه صوتی به ترتیب 80.6 درصد و 72.8 درصد بدست آمدهاست. راهکار دوم مبتنی بر تجزیه نامنفی سیگنال مشاهده جهت ذخیره بافت فرکانسی نمونه از صداها به صورت اتمها یا وصلههایصوتی در یک دیکشنری و سپس بازسازی سیگنال آزمایش از طریق تولید یک نمایش تنک از اتمهای دیکشنری در بازنمایی سگمنتهای آن سیگنال است. این روش در واقع مبتنی بر جداسازی و تفکیک یک سیگنال به اجزای اولیه یعنی وقایع صوتی است. معیار F1 در این روش برای شناسایی فریم و واقعه صوتی به ترتیب 56.5 درصد و 49.2 درصد بدست آمدهاست. این نتایج برتری روشهای پیشنهادی نسبت به روشهای پیشین بر روی پایگاه داده DCASE2013 را نشان میدهد.
کلید واژه ها (نمایه ها):
#شناسایی و ردهبندی وقایع صوتی #سگمنتبندی #استخراج ویژگی #جداسازی منابع صوت #تجزیه نامنفی ماتریس #نمایش تنک سیگنال #آنالیز صحنههای شنیداری #الگوریتمهای یادگیری ماشینی #اسپکتروگرام #نظارت و دیدهبانی صوتی دانلود نسخه تمام متن (رایگان)
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرودیادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده: