توسعه روش های مبتنی بر ویژگی برای جداسازی گفتار دو گوینده همزمان

پایان نامه
چکیده

در یک مهمانی، ما می توانیم به یک صدای خاص توجه ویژه داشته باشیم و دیگر صداهای تداخلی موجود در محیط اطراف خود را فیلتر نماییم. این قابلیت ادراکی، باعث ایجاد انگیزه ای برای پدید آوردن یک زمینه مطالعاتی جدید گردید. هدف این زمینه مطالعاتی، طراحی سیستم های جداسازی گفتار بر اساس اصول سیستم شنوایی انسان است. در بسیاری از کاربردها نظیر بازشناسی گفتار اتوماتیک و مخابرات راه دور به یک سیستم موثر که توانایی جداسازی سیگنال گفتار هدف از سیگنال تداخلی را در شرایط تک میکروفونه داشته باشد، نیاز می باشد. بر این اساس در این رساله، سیستمی برای جداسازی سیگنال گفتار از تداخل در شرایط تک میکروفونه ارائه می نماییم. سیستم جداسازی گفتار تک میکروفونه پیشنهادی بر اساس ویژگی فرکانس گام در حوزه فرکانس مدولاسیون طراحی گردیده است. جداسازی بر اساس فیلتر نمودن سیگنال نویزی با استفاده از ماسک تخمین زده شده در حوزه طیف مدولاسیون با به کارگیری محدوده فرکانس گام تخمین زده شده، انجام می گیرد. برای بهبود عملکرد سیستم جداسازی پیشنهادی، یک سیستم جداسازی تک میکروفونه ترکیبی نیز پیشنهاد می گردد. در این سیستم، از فیلتر نمودن مدولاسیون همدوس وفقی برای جداسازی زیرباندهای با فرکانس پایین و از سیستم جداسازی تک میکروفونه ناهمدوس بازگشتی برای جداسازی زیرباندهای با فرکانس بالا استفاده می گردد. در فیلتر نمودن مدولاسیون همدوس وفقی، برای حذف سیگنال تداخلی از فیلتر وفقی affine projection استفاده می گردد که این فیلتر بر روی سیگنال مدولاتور بدست آمده از تبدیل مدولاسیون همدوس، اعمال می گردد. همچنین با به کارگیری یک میکروفون اضافه یک سیستم جداسازی دو میکروفونه بر اساس ویژگی های اختلاف زمانی برای زیرباندهای با فرکانس پایین و اختلاف چگالی برای زیرباندهای با فرکانس بالا، به منظور افزایش کیفیت سیگنال جدا شده پیشنهاد می نماییم. در سیستم دو میکروفونه پیشنهادی، جداسازی سیگنال هدف از تداخل بر مبنای ماسک باینری زمان- فرکانس تخمین زده شده بر اساس دو ویژگی مکانی اختلاف زمانی و اختلاف چگالی انجام می گیرد. نتایج ارزیابی نشان می دهد که سیستم های پیشنهادی تک میکروفونه در مقابل تداخل مقاوم است و در شرایطی که انرژی سیگنال تداخلی زیاد باشد نیز قادر به جداسازی گفتار هدف با کیفیت خوب می باشد. همچنین نتایج بدست آمده از سیستم جداسازی دومیکروفونه نشان دهنده جداسازی قسمت های واکدار و بی واک سیگنال گفتار هدف از سیگنال تداخلی با کیفیتی مورد قبول است.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

یک روش جدید برای انتخاب ویژگی مبتنی بر منطق فازی

چکیده: انتخاب ویژگی یکی از چالش برانگیز ترین و از مهمترین فعالیت‌ها در توسعه یادگیری ماشین و تشخیص الگوست. معیارهای ارزیابی ویژگی نقش بسیار مهمی برای ساخت یک الگوریتم انتخاب ویژگی دارند. در این مقاله یک معیار انتخاب ویژگی اصلاح شده با استفاده از منطق فازی برای انتخاب تعداد ویژگی‌های مورد نیاز ارائه می شود. این معیار به شکل غیر فازی در تحقیقات قبلی استفاده می‌شود، اما در این مقاله با تعریف تعداد...

متن کامل

دو روش تبدیل ویژگی مبتنی بر الگوریتم های ژنتیک برای کاهش خطای دسته بندی ماشین بردار پشتیبان

Discriminative methods are used for increasing pattern recognition and classification accuracy. These methods can be used as discriminant transformations applied to features or they can be used as discriminative learning algorithms for the classifiers. Usually, discriminative transformations criteria are different from the criteria of  discriminant classifiers training or  their error. In this ...

متن کامل

بهبود عملکردد سیستم های جداسازی سیگنال گفتار دو گوینده در حالت تک میکروفونه

در این رساله روش جداسازی سیگنال دو گوینده زمانی که فقط به سیگنال مخلوط دریافت شده از یک میکروفون دسترسی داریم مورد بررسی قرار می گیرد. یطور کلی روش های جداسازی سیگنال در حالت تک میکروفونه به دو گروه تقسیم می شوند: گروه اول روش های را شامل می شود که اصول حاکم بر سیستم شنوایی انسان را برای جداسازی دنبال می کنند و گروه دوم روش های که با استفاده از اطلاعات قبلی از دو گوینده سیگنال مخلوط را مدل می ...

15 صفحه اول

تطبیق گوینده در بازشناسی گفتار پیوسته براساس تخمین map مبتنی بر تبدیل mllr

روشهای مختلفی برای تطبیق گوینده در سیستمهای بازشناسی گفتار معرفی گردیده اند. در برخی روشها نظیر تخمین map تنها مدلهایی که داده آموزشی متناظرشان موجود باشد تازه سازی می شوند و برای بهبود قابل توجه دقت بازشناسی، داده آموزشی نسبتاً زیادی مورد نیاز است. در برخی دیگر نظیر mllr که تعدادی تبدیلات عمومی بر روی خوشه های مدلها اعمال می شود، برای دادگان کم آموزشی نتایج مطلوبی حاصل می شود، اما با افزایش داد...

متن کامل

تشخیص حس وابسته به گوینده گفتار فارسی با استفاده از ویژگی های آکوستیکی

بیان احساس در ارتباطات روزمره از جایگاه ویژه ای برخوردار است. از جمله بسترهای نمود احساس، گفتار است. از این رو، یکی از جنبه های مهم در طبیعی سازی ارتباط میان انسان و ماشین، تشخیص حس گفتار و تولید بازخورد متناسب با احساس درک شده است. باوجود پیشرفت های گسترده در حوزه پردازش گفتار، استخراج و درک احساس پنهان در گفتار انسان، همچون خشم، شادی و جز این ها، از یک سو و تولید گفتار احساسی مناسب از سوی دیگ...

متن کامل

توسعه روشهای مبتنی بر فرض توزیع غیرگوسی برای بهسازی گفتار

با توجه به کاربرد روزافزون سیستم های گفتاری در زندگی امروزی، کارهای بسیاری در زمینه بهسازی و بازشناسی گفتار صورت گرفته که در همه این کاربردها وجود نویز و پژواک باعث کاهش کارآیی سیستم های گفتاری می شود. تاکنون تعداد زیادی از الگوریتم های بهسازی گفتار براساس تخمین دامنه طیف سیگنال گفتار و هم چنین تخمین ضرایب حقیقی و موهومی طیف گفتار مبتنی بر معیار mmse و map و با فرض گوسی بودن مولفه های دکارتی ضر...

15 صفحه اول

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده برق و کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023