پایانامه های دانشگاه صنعتی شاهرود

TK140: تعیین محل لحظه ای افراد صحبت کننده در یک اتاق سمینار

پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی برق > مقطع کارشناسی ارشد > سال 1389

پدیدآورندگان:

محمد حسام محمودی نژاد [پدیدآور اصلی]، حسین مروی[استاد راهنما]، علیرضا احمدی فرد[استاد مشاور]

چکیده: با بهبود تکنولوژی میکروالکترونیک و الگوریتم های تعیین محل و ردیابی صحبت کننده، امروزه می‌توان از اینگونه سیستم‌ها، برای مصرف کننده‌ها و بازارهای تجاری بهره گرفت. همچنین علاقمندی فراوانی برای یک کاربرد جدید در اتاق‌های مجهز به سنسورهای مختلف معروف به اتاق کنفرانس هوشمند در حال گسترش است. در این تحقیق ما به دنبال تعیین محل لحظه‌ای افراد صحبت‌کننده در داخل یک اتاق سمینار می‌باشیم. باید در هر لحظه مشخص کنیم چند منبع فعال وجود دارد و سپس محل این منابع را در فضای فیزیکی تخمین بزنیم. تعیین محل در شرایط مختلفی نظیر: یک یا چند صحبت‌کننده به‌طورهمزمان و اینکه صحبت کننده‌ها به هر دو فرم ساکن و در حال حرکت، باشند و در حالت‌های نویزی مختلف، می‌تواند مورد بررسی قرار گیرد. در ابتدا با شبکه‌بندی فضای اتاق سمینار و با استفاده از الگوریتم SRP-PHAT محل لحظه‌ای افراد صحبت‌کننده را مشخص می‌نماییم. از اطلاعات جهت سر صحبت کننده‌ها استفاده شده تا از آرایه‌های میکروفنی که در راستای مستقیم با جهت سر صحبت‌کننده قرار دارند استفاده کنیم، و تاثیر انعکاسات گرفته‌شده از سایر میکروفن‌ها را تضعیف نماییم. تابع استفاده شده در این الگوریتم را OPROD-PHAT می‌نامیم. در این بخش یک سیستم برای تعیین محل همزمان چندین صحبت‌کننده پیشنهاد می‌گردد، که در آن، توسط یک الگوریتم دو‌مرحله‌ای ابتدا با استفاده از یک آستانه تطبیقی بر حسب انرژی هر فریم، فریم‌های بی‌صدا را جدا کرده و در ادامه توسط مشخصات همبستگی متقابل بین سیگنال یک جفت میکروفن، در مورد تعیین‌محل لحظه‌ای صحبت‌کننده‌ها تصمیم‌گیری می‌گردد. در ادامه برای کاهش تاثیر نویز زمینه، و افزایش سرعت جستجوی فضای اتاق سمینار و همچنین تعیین محل مناسب‌تر چند صحبت‌کننده به‌طور‌همزمان، با بخش‌بندی کردن فضای اتاق، یک میزان فعالیت صوتی را در هر بخش تعیین نموده و در هر فریم زمانی، هدف تعیین بخش‌های شامل صحبت کننده فعال می‌باشد. به دلیل وجود نویز متغیر، از یک آستانه وفقی با استفاده از الگوریتم EM برای تعیین فعال بودن هر بخش بهره می‌گیریم. سپس با استفاده از یکی از روش‌های غیر‌مستقیم TDE، به نام روش LI، در بخش‌های فعال محل صحبت‌کننده‌ها را تعیین می‌نماییم. توسط این ایده می‌توان روش‌های دو مرحله‌ای را برای تعیین چندین منبع صوتی به طور همزمان استفاده کرد. در نهایت به ارزیابی الگوریتم‌های پیشنهادی می‌پردازیم. نتایج حاصله عملکرد مناسب الگوریتم‌های پیشنهادی را در بالا بردن دقت تعیین محل افراد صحبت‌کننده نشان می‌دهند.

کلید واژه ها (نمایه ها):

#تعیین محل افراد صحبت‌کننده #آرایه میکروفنی #تخمین تاخیر زمانی (TDE) #اتاق سمینار #روش SRP-PHAT #جهت سر صحبت‌کننده

دانلود نسخه تمام متن (رایگان)

محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده:

پایان نامه های مرتبط (بر اساس کلیدواژه ها)

دانشگاه صنعتی شاهرود
Shahrood University of
Technology

دسترسی سریع

وبگاه‌ها