توسعه و بهبود روش های مکان یابی چند منبع گفتار همزمان

پایان نامه
چکیده

هدف از این رساله، مکان یابی چند گوینده هم زمان از روی سیگنال های گفتار هم پوشانی دار گوینده ها است. روش های مبتنی بر تابع همبستگی متقابل تعمیم یافته (gcc) از مهم ترین روش های مطرح در این زمینه هستند. این روش ها در شرایط نامطلوب آکوستیکی دقت مناسبی نداشته و هم چنین نمی توانند گوینده های نزدیک به هم را به خوبی مکان یابی کنند. مشکل دیگر نیز، الیاسینگ فضایی در سیگنال های میکروفونی است که باعث تخریب اطلاعات ورودی سیستم می شود. محور کلی روش های پیشنهادی در این رساله، پردازش های زیرباندی برای بهره گیری از عدم هم پوشانی محتوای فرکانسی گفتار گویندگان مختلف است. در اولین روش پیشنهادی، سیگنال های میکروفونی نخست به باندهای مختلفی (به صورت یکنواخت) تقسیم بندی می شوند. سپس تابع gcc برای همه زوج میکروفون ها در همه زیرباندها محاسبه شده و نمودار هیستوگرام محل دو قلّه اول تابع gcc برای هر زیرباند بدست می آید. در ادامه، با استفاده از روش متوسط گیری وزن دار، این هیستوگرام ها ترکیب و از روی هیستوگرام نهایی، راستای دو گوینده ی همزمان تخمین زده می شود. هر چند این روش افزایش دقت مکان یابی را به دنبال دارد، ولی مسأله ی الیاسینگ فضایی و لزوم مشخص بودن تعداد گوینده، دو مشکل اصلی باقیمانده در این روش است. دوّمین روش پیشنهادیِ این رساله، هدف خود را بر روی تخمین تعداد گوینده و حذف الیاسینگ فضایی قرار می دهد. با استفاده از روش خوشه بندی k-means و اصل silhouette، روشی مبتنی بر پردازش های زیرباندی برای تخمین تعداد گوینده معرفی و سیستم مکان یابی به حالت بیش از دو گوینده تعمیم می یابد. سپس به منظور حذف الیاسینگ فضایی، آرایه میکروفونی دایره ای تودرتو پیشنهاد داده می شود که می تواند الیاسینگ فضایی را برای میکروفون های دور از هم حذف کند. علاوه بر این، با بهره گیری از یک بلوک تخمین نویز و استفاده وفقی از فیلترهای phat و ml، دقت سیستم در تخمین راستای گوینده در حضور نویز و انعکاس افزایش می یابد. در دو روش قبلی، فیلترهای استفاده شده بدون توجه به محتوای فرکانسی سیگنال گفتار اعمال می شود. در قسمت سوم رساله، استفاده از فیلترهای گاماتون را پیشنهاد می دهیم که متناسب با سیستم شنوایی انسان بوده و بر روی محتوای فرکانس پایین طیف سیگنال گفتار، قدرت تفکیک فرکانسی بالاتری دارند. ترکیب استفاده از این بانک فیلتر با روش زیرباند کردن با آرایه تودرتو، اگرچه حجم محاسبات را کمی بالا می برد ولی دقت تخمین های بدست آمده را تا حد مطلوبی افزایش می دهد. در ادامه برای کاهش بار محاسباتی، با تخمین طیف سیگنال گفتار از روش pwelch، فیلترهای گاماتون فقط بر روی نواحی پردامنه طیف گفتار بکار گرفته شده و سپس پردازش های زیرباندی با آرایه تودرتو بر روی خروجی فیلترهای گاماتون اعمال می شود. این اقدام ضمن حفظ دقت تخمین در حد روش قبلی، حجم محاسبات را تا حد خوبی کاهش می دهد. ارزیابی های این رساله بر روی سناریوهای مختلف محیطی اعم از انعکاسی، نویزی، و نویزی و انعکاسی توأم و هم چنین بر روی داده های واقعی و شبیه سازی و به ازای یک، دو و سه گوینده هم زمان انجام شده است. در ارزیابی های انجام شده، روش subband-gcc با روش های fullband و هم چنین subband-srp مقایسه شده است که برتری روش پیشنهادی را نشان می دهد. هم چنین در ادامه روش های پیشنهادی آرایه های تودرتو، فیلتر گاماتون و تخمین طیف نیز مورد ارزیابی و مقایسه قرار گرفته است که نتایج نشانگر برتری روش های پیشنهادی نسبت به روش های مرسوم می باشد.

منابع مشابه

بهبود عملکرد سیستم های مکان یابی منبع گفتار در محیط های واقعی

مکان یابی منبع گفتار یکی از زیر شاخه های سیستم های پردازش گفتاری می باشد. در این پژوهش مکان یابی منبع گفتار با استفاده از روش های مبتنی بر srp مدنظر بوده است. روش استفاده شده در این پژوهش روش srp-phat است. روش srp-phat در مکان یابی منبع گفتار تحت شرایط انعکاسی، مقاوم می باشد. در حقیقت این روش که بر مبنای شکل دهی پرتو آرایه میکروفونی بنا نهاده شده است، سعی می کند با جستجوی فضا، ماکزیمم انرژی در ...

15 صفحه اول

مکان یابی چند گوینده همزمان

مکان یابی منبع گفتار در بسیاری از سیستم های پردازش گفتار از قبیل سیستم های تله کنفرانس، سیستم های بازشناسی صوت، اتاق های کنفرانس هوشمند و سیستم های کمک شنوایی کاربرد دارد. امروزه مکان یابی منبع صوت با کمک آرایه های میکروفونی از موضوعات مورد توجه می باشد. این آرایه ها در نهایت سیگنال دارای کیفیت مطلوب را از منبع صوتی تهیه می کنند و منابع صوتی غیر دلخواه را حذف می کنند. اما یکی از چالش های پیش رو...

15 صفحه اول

مکان یابی مناسب ترین محل دفن زباله های جامد شهر یاسوج با روش تحلیل چند معیاره

 Background and aims: In most multi criteria decision making issues, a desirable alternative which suit all aspects does not exist. In current assessment methods, after considering all criteria, the advantages and disadvantages of the best alternative remain imperceptible. The objective of this study was to present a simple approach for such decision making cases.  Methods: The approach was app...

متن کامل

تحلیلی بر مکان یابی شهرک های صنعتی شهرستان بستان آباد با استفاده از روش های تصمیم گیری چند معیاره

هدف اصلی این پژوهش،تحلیلی بر مکان یابی شهرک های صنعتی شهرستان بستان آباد با استفاده از روش های تصمیم گیری چند معیاره می باشد.روش تحقیق توصیفی- تحلیلی بوده و برای جمع آوری داده ها و اطلاعات از مطالعات اسنادی، کتابخانه ای، پرسش نامه و سازمان های ذیربط استفاده شده است، به این منظور بعد از انتخاب معیارها و طبقه بندی آنها در چهار گروه، سوالات و پرسشنامه تدوین گردید،در مرحله بعد با نظرخواهی از20نفر ا...

متن کامل

بهبود SNR در مکان یابی با UWB با استفاده از الگوریتم های کنترل توان

در مکان­یابی فضای سرپوشیده با استفاده ار باند فوق وسیع، مقدار نسبت سیگنال به نویز (SNR) نقش بسزایی در مکان­یابی دارد.در مکان­یابی عواملی از قبیل اثر پدیده نویز،اثر پدیده چند مسیری و اثر انتشار بدون دید مستقیم سبب تضعیف در دقت و صحت در مکان­یابی در فضای سرپوشیده می­شود.مکان­یابی با استفاده از باند فوق وسیع یک راه حل مناسب موقعیت­یابی در فضای سرپوشیده است بهبود SNR در این روش­ سبب افزایش در دقت و...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده مهندسی برق و کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023