نام پژوهشگر: عزیزه راستگار

بازشناسی گوینده وابسته به متن
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی 1386
  عزیزه راستگار   فرشاد الماس گنج

دراین تحقیق طراحی و بکارگیری سیستمهای بازشناسی گوینده ارائه شده است. بازشناسی گوینده، استفاده از یک ماشین جهت بازشناسی یک شخص از یک عبارت بیان شده است. این سیستمها می توانند به دو روش عمل کنند : شناسایی یک شخص بخصوص یا تآیید ادعای شخص مدعی، شناسایی یک شخص با استفاده از ویژگیهای فیزیکی از قبیل گفتار، نمونه ای از اهمیت تجاری در زمینه امنیتی است. بازشناسی گفتار یک روش شناسایی شخص، مبتنی بر استخراج مشخصه از لغات صحبت شده و سپس طبقه بندی آنها بصورت وابسته به یک شخص است. هدف از اجرای این پروژه، بکارگیری سیستمی است که قادر به شناسایی یک شخص از نمونه گفتارش باشد. نتایج حاصل از این کار برای سیستم های وابسته به متن و مستقل از متن صادق می باشد. مشخصات بکارگرفته شده توسط این سیستم که دو نمونه گفتار را مقایسه می کند عبارتند از : تخمین pitch، اطلاعات طیفی (ضرائب ویولت) و ضرائب مل کپستروم. این مشخصات جهت ایجاد خصوصیات گفتار به کار می روند که در یک پایگاه داده ذخیره می گردند. در مرحله بعدی از یک نمونه گفتار تست با استفاده از الگوریتم های مذکور ویژگیها استخراج گردیده و با ویژگیهای گفتار ذخیره شده در پایگاه داده توسط شبکه عصبی مقایسه می شود و نتایج حاصله که حاکی از شخص شناسایی شده می باشد بدست می آید. در روش وابسته به متن انجام گرفته در این پروژه، یک گروه 30نفری از مرد وزن مورد آزمایش قرار گرفتند و برای روش مستقل از متن، از 50 گوینده دادگان فارس دات استفاده گردید. نتایج حاصل از بازشناسی، برای روش اول 100 درصد صحت بازشناسی و برای روش دوم 4 درصد خطا را نشان می دهند که در مقایسه با روش mfcc تقریبا 4 درصد بهبود حاصل گردیده است. برای افزایش درصد بازشناسی می توان از ترکیب ویژگیهای استخراج شده استفاده نمود. همچنین در این پروژه استفاده از ویژگیهای prosody باعث کاهش خطا در بازشناسی در حدود 10 درصد شده است.