نام پژوهشگر: ندا فرجی

آنالیز مولفه مستقل و استفاده از آن برای بهبود بازشناسی گفتار فارسی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی برق 1385
  ندا فرجی   محمد احدی

در این پروژه، استفاده از آنالیز مولفه مستقل خطی (lica) با توجه به قدرت آن در مدل کردن اطلاعات آماری مرتبه بالای گفتار مورد بررسی قرار گرفته است. ما از این روش برای تطبیق هرچه بیشتر بخش استخراج ویژگی با داده مورد پردازش استفاده کردیم.در بخشی از کار از آن برای تخمین فیلتربانک مبتنی بر داده استفاده کردیم و نشان دادیم که فیلتربانک بدست آمده از این روش قادر است ویژگیهایی را استخراج کند که مقاومت بیشتری دربرابر نویز دارند. ما آزمایشات خود را در این قسمت روی پایگاه داده اعداد متصل aurora2 و پایگاه داده گفتار پیوسته فارسی farsdat با دایره لغات متوسط انجام دادیم. نتایج روی پایگاه داده 2 aurora به ازای پارامترهای مختلف بدست آمد. بهترین نتیجه، نشان دهنده کاهش 9 درصدی خطای بازشناسی نسبت به سیستم پایه بوده است. با اینهمه، نتایج بازشناسی اولیه روی farsdat کاهش شدیدی نسبت به حالت پایه نشان داد که ناشی از نحوه انتخاب بردارهای پایه غالب در آن بود. ما برای بهبود نتایج، یک روش محلی برای انتخاب توابع پایه غالب ica ارائه کردیم که موجب کاهش 17 درصدی خطای بازشناسی نسبت به حالت پایه و درشرایط تست نویزی شد.در بخشی دیگری از پروژه با استفاده از آنالیز مولفه مستقل، یک فیلتر زمانی طیف طراحی شده که در طولهای کمتر نتایج بهتری را نسبت به سایر روشهای آماری می دهد و از اینرو می تواند حائز اهمیت واقع شود. نوآوری ما در این قسمت، تلفیق دو روش آنالیز مولفه اساسی (pca) و ica به دو صورت متفاوت می باشد که منجر به بهبود نتایج بازشناسی شده است.در ادامه به بهسازی گفتار با استفاده از یک روش مبتنی بر ica پرداخته شده است. روش بکاررفته در بهسازی، انقباض کدگذاری پراکنده (scs) نام دارد که عملکرد آن به پارامتری به نام سطح آستانه نرم بستگی دارد و در سیگنال به نویزهای پایین افت می کند. ما از یک تبدیل بهینه خطی برای کاهش سطح آستانه و متعاقب آن بهبود عملکرد scs در سیگنال به نویزهای پایین استفاده کردیم. علاوه بر این، روش بهسازی ارائه شده در نویزهای مختلف دارای راندمان قابل قبولی است.همچنین در این پروژه، ما روش pca-fx را که یک نوع روش آنالیز مولفه اساسی با سرپرستی است، برای بهینه کردن شکل فیلترهای مل بکاربردیم که البته بهبودی چندانی نسبت به pca نداشته است.درادامه کار می توان از مدلهای پیچیده تر، ica غیرخطی و مدل کانوالوی، که انطباق واقعیتری با پدیده های طبیعی دارند، استفاده کرد.