نام پژوهشگر: محمد حسام محمودی نزاد

تعیین محل لحظه ای افراد صحبت کننده در یک اتاق سمینار
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود 1389
  محمد حسام محمودی نزاد   حسین مروی

با بهبود تکنولوژی میکروالکترونیک و الگوریتم های تعیین محل و ردیابی صحبت کننده، امروزه می توان از اینگونه سیستم ها، برای مصرف کننده ها و بازارهای تجاری بهره گرفت. همچنین علاقمندی فراوانی برای یک کاربرد جدید در اتاق های مجهز به سنسورهای مختلف معروف به اتاق کنفرانس هوشمند در حال گسترش است. در این تحقیق ما به دنبال تعیین محل لحظه ای افراد صحبت کننده در داخل یک اتاق سمینار می باشیم. باید در هر لحظه مشخص کنیم چند منبع فعال وجود دارد و سپس محل این منابع را در فضای فیزیکی تخمین بزنیم. تعیین محل در شرایط مختلفی نظیر: یک یا چند صحبت کننده به طورهمزمان و اینکه صحبت کننده ها به هر دو فرم ساکن و در حال حرکت، باشند و در حالت های نویزی مختلف، می تواند مورد بررسی قرار گیرد. در ابتدا با شبکه بندی فضای اتاق سمینار و با استفاده از الگوریتم srp-phat محل لحظه ای افراد صحبت کننده را مشخص می نماییم. از اطلاعات جهت سر صحبت کننده ها استفاده شده تا از آرایه های میکروفنی که در راستای مستقیم با جهت سر صحبت کننده قرار دارند استفاده کنیم، و تاثیر انعکاسات گرفته شده از سایر میکروفن ها را تضعیف نماییم. تابع استفاده شده در این الگوریتم را oprod-phat می نامیم. در این بخش یک سیستم برای تعیین محل همزمان چندین صحبت کننده پیشنهاد می گردد، که در آن، توسط یک الگوریتم دو مرحله ای ابتدا با استفاده از یک آستانه تطبیقی بر حسب انرژی هر فریم، فریم های بی صدا را جدا کرده و در ادامه توسط مشخصات همبستگی متقابل بین سیگنال یک جفت میکروفن، در مورد تعیین محل لحظه ای صحبت کننده ها تصمیم گیری می گردد. در ادامه برای کاهش تاثیر نویز زمینه، و افزایش سرعت جستجوی فضای اتاق سمینار و همچنین تعیین محل مناسب تر چند صحبت کننده به طور همزمان، با بخش بندی کردن فضای اتاق، یک میزان فعالیت صوتی را در هر بخش تعیین نموده و در هر فریم زمانی، هدف تعیین بخش های شامل صحبت کننده فعال می باشد. به دلیل وجود نویز متغیر، از یک آستانه وفقی با استفاده از الگوریتم em برای تعیین فعال بودن هر بخش بهره می گیریم. سپس با استفاده از یکی از روش های غیر مستقیم tde، به نام روش li، در بخش های فعال محل صحبت کننده ها را تعیین می نماییم. توسط این ایده می توان روش های دو مرحله ای را برای تعیین چندین منبع صوتی به طور همزمان استفاده کرد. در نهایت به ارزیابی الگوریتم های پیشنهادی می پردازیم. نتایج حاصله عملکرد مناسب الگوریتم های پیشنهادی را در بالا بردن دقت تعیین محل افراد صحبت کننده نشان می دهند. کلمات کلیدی: تعیین محل افراد صحبت کننده، آرایه میکروفنی، تخمین تاخیر زمانی (tde)، اتاق سمینار، روش srp-phat ، جهت سر صحبت کننده