نام پژوهشگر: معصومه حسام

جداسازی سیگنال صحبت بر پایه ica برای بهبود کیفیت گفتار
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه تبریز 1389
  معصومه حسام   مسعود گراوانچی زاده

تاکنون انواع مختلفی از تکنیک های بهبود گفتار مورد مطالعه قرار گرفته اند. از آنجایی که نویزهای متنوعی در محیط وجود دارند، هیچ یک از تکنیک های بهبود گفتار برای حذف همه انواع نویز مناسب نیستند. علاوه بر نویز پس زمینه در محیط، وجود سیگنال های تداخلی صحبت و همچنین انعکاس-های محیط، مسئله بهبود گفتار را پیچیده تر می کند و لزوم الگوریتم های حذف پژواک و تفکیک منابع را برای این منظور فراهم می آورد. اخیراً جداسازی کور منبع برای مخلوط های کانولوتیو در حوزه فرکانس به عنوان روشی برای تفکیک منابع صوتی معرفی شده است. در این روش از یکی از الگوریتم های ica همچون infomax به طور جداگانه در هر فرکانس، برای جداسازی مولفه های فرکانسی منابع استفاده می شود. الگوریتم infomax با اندازه گام ثابت از نظر همگرایی و پایداری دارای معایبی است. اگر اندازه گام کوچک انتخاب شود، سرعت همگرایی کاهش می یابد و اگر بزرگ انتخاب شود، ممکن است باعث ناپایداری الگوریتم شود. در بخشی از این پایان نامه روشی بر پایه تکنیک pso برای تعیین اندازه گام مناسب در الگوریتم infomax پیشنهاد می کنیم که موجب همگرایی بیشتر الگوریتم می شود. از سویی پس از جداسازی مولفه های فرکانسی منابع در هر فرکانس، برای بازسازی صحیح سیگنال ها از روی مولفه های فرکانسی در حوزه زمان باید مولفه های فرکانسی مربوط به هر یک از منابع دسته بندی شوند. این مسئله، جایگشت در حوزه فرکانس نام دارد و روش های متعددی برای حل آن وجود دارد. در بخش دیگری از این پایان نامه روشی برای حل مسئله جایگشت با استفاده از همبستگی نسبت توان (power ratio) مولفه های فرکانسی در حالت overdetermind، یعنی وقتی که تعداد میکروفون ها بیشتر از تعداد منابع باشد، پیشنهاد می شود.