پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی برق > مقطع کارشناسی ارشد > سال 1402
پدیدآورندگان:
آرش فامرینی [پدیدآور اصلی]، حسین مروی[استاد راهنما]
چکیده: جداکردن صدای آواز از موسیقی همواره توجه زیادی را در زمینه پردازش سیگنال‌های صوتی در سال‌های اخیر به خود جلب کرده‌است و در بسیاری از کاربردها مانند شناسایی خواننده ، بازیابی اطلاعات موسیقی، رونویسی خودکار آواز خواندن و بازیابی موسیقی مبتنی بر محتوا بسیار مفید است. با توجه به این‌که سیگنال گفتار یک سیگنال ناایستا است و مشخصات آن با زمان تغییر می‌کند لذا یکی از بهترین روش‌ها برای تحلیل این سیگنال‌ها و استخراج ویژگی از آن روش‌های زمان- فرکانس می‌باشد. بر این اساس، ما در این پایان‌نامه روشی بر پایه زمان – فرکانس با استفاده از شبکه‌های عصبی عمیق CNN و FCNN برای جداسازی صدا و موسیقی ارائه کردیم. نتایج شبیه‌سازی بر روی پایگاه داده MIREX2018 نشان داد که در روش تبدیل فوریه زمان کوتاه به درصد جداسازی 85.02% برای CNN و 87.18% برای FCNN و برای روش ویگنرویل 86.15% برای CNN و 87.03% برای FCNN و در روش گابور نیز 82.74% برای CNN و 85.22% برای FCNN دست یافتیم. همچنین نتایج شبیه‌سازی نشان داد که در تمامی حالت‌ها به غیر از یک حالت روش شبکه عصبی کانولوشنی تماما متصل (FCNN) نتایج و عملکرد بهتری را ارائه می‌دهد.
کلید واژه ها (نمایه ها):
#موسیقی #جداسازی #شبکه عصبی عمیق #آواز #فرکانس #زمان #کانولوشن #ویگنر-ویل #گبور #تبدیل فوریه
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده:
پایان نامه های مرتبط (بر اساس کلیدواژه ها)