نام پژوهشگر: سید مصطفی موسوی بورا

تایید هویت با استفاده از پردازش سیگنال گفتار
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه شاهد - دانشکده فنی و مهندسی 1389
  سید مصطفی موسوی بورا   حامد ساجدی

یکی از روشهای تأیید و تعیین هویّت افراد، استفاده از صدای فرد می باشد که مقوله شناسایی گوینده و تصدیق و تعیین هویت گوینده نام دارد. از جمله روشهایی که در پردازش گفتار و بطور خاص در شناسایی گوینده کارآیی بسیار خوبی از خود نشان داده است، مدل چندی سازی برداری و مدل شبکه عصبی می باشد که وسیله ای بسیار قوی برای مدل کردن سیگنال های تصادفی و ایستا می باشند. در این پروژه ما از مدل چندی سازی برداری و هم از مدل شبکه عصبی از نوع پرسپترون چند لایه برای تصدیق و تعیین هویت گوینده های از روستای بالابورا از توابع منطقه بندپی غربی شهرستان بابل که می توانند به سه زبان انگلیسی،فارسی و زبان مازندرانی(مازنی) صحبت کنند، بکار گرفته شده است. با توجه به تمهیدات بکار گرفته شده در این پروژه، بر روی سه پایگاه داده از ارقام برای هر سه زبان متشکل از 20 نفر (12 مرد و 8زن) که در سنین مختلف 12 تا 61 سال بوده اند و ارقام صفر تا نُه را بیان کرده اند، کارآیی سیستم شناسایی گوینده طراحی شده در این پروژه برای تعیین هویت گوینده در هر کدام از این سه زبان مشخص شده است. بطوریکه نتایج حاصل نشان می دهد که درصد شناسایی این سیستم توسط این دو روش در هر سه زبان متفاوت بوده، بطوریکه در مرحله اول دقت سیستم توسط روش vq تأیید گوینده به زبانهای انگلیسی، فارسی و مازنی بترتیب با 26mfcc برابر با 94.7 %، 92.6 % و 91.3 % شده است که در مرحله دوم با استفاده از یک نوع شبکه عصبی پیشنهادی توسط26lpcc بترتیب برابر با 99.6%، 98.7% و 97.9% بهبود یافته است. در مراحل مختلف این پروژه تأثیر تعداد دفعات ارائه داده های آموزشی به شبکه عصبی، تاثیر تعداد ویژگیها و نوع ویژگی از نقطه نظر ایستا و گذرا بودن و نیز تاثیر ایجاد تغییرات در پارامترهای یادگیری شبکه، مورد بررسی قرار گرفت. همچنین طی آزمایشهایی کارائی سیستم تصدیق هویت پیشنهاد شده ارزیابی و نتایج حاصل از بازشناسی ارقام و تصدیق هویت با استفاده از روشهای گفته شده با نتایج حاصل از روش کلاسیک چندی سازی برداری مقایسه گردید.