پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی برق > مقطع کارشناسی ارشد > سال 1389
پدیدآورندگان:
محمد حسام محمودی نژاد [پدیدآور اصلی]، حسین مروی[استاد راهنما]، علیرضا احمدی فرد[استاد مشاور]
چکیده: با بهبود تکنولوژی میکروالکترونیک و الگوریتم های تعیین محل و ردیابی صحبت کننده، امروزه میتوان از اینگونه سیستمها، برای مصرف کنندهها و بازارهای تجاری بهره گرفت. همچنین علاقمندی فراوانی برای یک کاربرد جدید در اتاقهای مجهز به سنسورهای مختلف معروف به اتاق کنفرانس هوشمند در حال گسترش است.
در این تحقیق ما به دنبال تعیین محل لحظهای افراد صحبتکننده در داخل یک اتاق سمینار میباشیم. باید در هر لحظه مشخص کنیم چند منبع فعال وجود دارد و سپس محل این منابع را در فضای فیزیکی تخمین بزنیم. تعیین محل در شرایط مختلفی نظیر: یک یا چند صحبتکننده بهطورهمزمان و اینکه صحبت کنندهها به هر دو فرم ساکن و در حال حرکت، باشند و در حالتهای نویزی مختلف، میتواند مورد بررسی قرار گیرد.
در ابتدا با شبکهبندی فضای اتاق سمینار و با استفاده از الگوریتم SRP-PHAT محل لحظهای افراد صحبتکننده را مشخص مینماییم. از اطلاعات جهت سر صحبت کنندهها استفاده شده تا از آرایههای میکروفنی که در راستای مستقیم با جهت سر صحبتکننده قرار دارند استفاده کنیم، و تاثیر انعکاسات گرفتهشده از سایر میکروفنها را تضعیف نماییم. تابع استفاده شده در این الگوریتم را OPROD-PHAT مینامیم. در این بخش یک سیستم برای تعیین محل همزمان چندین صحبتکننده پیشنهاد میگردد، که در آن، توسط یک الگوریتم دومرحلهای ابتدا با استفاده از یک آستانه تطبیقی بر حسب انرژی هر فریم، فریمهای بیصدا را جدا کرده و در ادامه توسط مشخصات همبستگی متقابل بین سیگنال یک جفت میکروفن، در مورد تعیینمحل لحظهای صحبتکنندهها تصمیمگیری میگردد.
در ادامه برای کاهش تاثیر نویز زمینه، و افزایش سرعت جستجوی فضای اتاق سمینار و همچنین تعیین محل مناسبتر چند صحبتکننده بهطورهمزمان، با بخشبندی کردن فضای اتاق، یک میزان فعالیت صوتی را در هر بخش تعیین نموده و در هر فریم زمانی، هدف تعیین بخشهای شامل صحبت کننده فعال میباشد. به دلیل وجود نویز متغیر، از یک آستانه وفقی با استفاده از الگوریتم EM برای تعیین فعال بودن هر بخش بهره میگیریم. سپس با استفاده از یکی از روشهای غیرمستقیم TDE، به نام روش LI، در بخشهای فعال محل صحبتکنندهها را تعیین مینماییم. توسط این ایده میتوان روشهای دو مرحلهای را برای تعیین چندین منبع صوتی به طور همزمان استفاده کرد.
در نهایت به ارزیابی الگوریتمهای پیشنهادی میپردازیم. نتایج حاصله عملکرد مناسب الگوریتمهای پیشنهادی را در بالا بردن دقت تعیین محل افراد صحبتکننده نشان میدهند.
کلید واژه ها (نمایه ها):
#تعیین محل افراد صحبتکننده #آرایه میکروفنی #تخمین تاخیر زمانی (TDE) #اتاق سمینار #روش SRP-PHAT #جهت سر صحبتکننده دانلود نسخه تمام متن (رایگان)
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرودیادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده: