نام پژوهشگر: اشکان نیک آیین

استفاده از شبکه عصبی در روشهای اصلاح طیف فرکانسی به منظور بهسازی سیگنال گفتار
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه اراک - دانشکده فنی 1392
  اشکان نیک آیین   محسن رحمانی

کاهش نویز در بسیاری زمینه ها از جمله بهبود سیگنال ورودی پردازشگرهای صوتی جهت تشخیص گفتار و یا شناسایی گوینده و نیز گوشی های تلفن همراه و ... دارای اهمیت زیادی می باشد. تاکنون روشهای بسیاری جهت بهبود و اصلاح سیگنال گفتار با استفاده از طیف فرکانسی دوره کوتاه سیگنال گفتار ارائه شده اند. عموم این روشها فیلتری را ارائه می دهند که بهره آن تابعی از نسبت سیگنال به نویز بوده و در حوزه فرکانس پس از اعمال به طیف فرکانسی سیگنال نویزی، تخمینی از طیف فرکانسی سیگنال تمیز را به دست می دهند. این فیلترها دارای مقداری بین صفر و یک هستند. در فرکانسهایی که نسبت سیگنال به نویز بالاست، سعی در تقویت سیگنال می نمایند و بر عکس در فرکانسهای با نسبت سیگنال به نویز پایین، در جهت کاهش مولفه فرکانسی عمل می کنند. در این پایان نامه فیلترهایی جهت اصلاح طیف فرکانسی ارائه می شوند که برای تولید آنها از شبکه های عصبی استفاده می گردد. ورودیهای فیلتر که در اصل یک شبکه عصبی است فیلترهای پایین گذر مرتبه اول و یا شبکه های بازگشتی مرتبه اول هموارکننده ایست که جهت هموارسازی طیف توان کوتاه مدت سیگنال نویزی استفاده می شوند. در این پایان نامه سعی شده است روشی برای کاهش نویز از سیگنال گفتار دیجیتال با استفاده از شبکه های عصبی به منظور بهبود سیگنال توسط اصلاح طیف فرکانسی ارائه شود. در عمل چندین نوع فیلتر بر حسب نوع خروجی در نظر گرفته شده، بررسی شده و بهترین آنها معرفی می شود. در نهایت نتایج اعمال این فیلتر بر روی تعداد زیادی سیگنال نویزی با نتایج فیلتر تفاضل طیف توان، و با استفاده از معیارهای pesq ، nplr و snri مقایسه گردیده اند. با توجه به این که فیلتر تفاضل طیف توان مورد استفاده از پس پردازشگر جهت حذف نویز موسقیایی و شکل دهی نویز استفاده می کند، با این وجود نتایج حاصل از فیلتر شبکه عصبی معرفی شده کاملاً نزدیک به نتایج حاصل از اعمال فیلتر تفاضل طیف توان می باشد.