نام پژوهشگر: مجتبی لطفی زاده

تشخیص هویت گوینده توسط کامپیوتر
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس 1372
  محمد مندولکانی   مجتبی لطفی زاده

شناسایی گوینده توسط کامپیوتر شامل دو مقوله است : تشخیص هویت و تصدیق هویت . تشخیص هویت گوینده توسط کامپیوتر براساس پردازش سیگنال صحبت گوینده صورت می گیرد . این تحقیق در زمینه تشخیص هویت جوینده صورت گرفته است . چند گوینده در چندین روزجملاتی (عباراتی) را تکرار کرده اند و مشخصات گوینده از سیگنال صحبت استخراج می شود و برای هر گوینده کلاس مرجع تشکیل میشود . وقتی گوینده مجهولی صحبت می کند، الگوریتم پس از استخراج ویژگیهای لازم از صحبت وی و مقایسه با کلاسهای مرجع، هویت وی را به یکی از گویندگان مرجع تشخیص می دهد. این تحقیق به روش وابسته به متن صورت گرفته است . دراین روش الگوریتم فقط برای جمله خاصی طراحی می شود و فقط با همان جمله خاص جواب میدهد. تشخیص هویت گوینده به روش مستقل از متن بسیار پیچیده ترو مشکلتر از مقوله دیگراست . این تحقیق برای 10 گوینده صورت گرفته است . هر گوینده جمله ای را 20 بار تکرار کرده است ، 10 تکرار هر گوینده برای تشکیل الگوی مرجع وی و 10 تکرار بعدی برای آزمایش الگوریتم به کار رفته است . الگوریتم طراحی شده بگونه ای است که می توان آن را برای هر تعداد گوینده (تعداد محدود) و هر جمله ای (جمله کوتاه) تعلیم داد. ویژگیهای صوتی زیادی را می توان برای این کار درنظر گرفت . دراین پروژه ضرایب lpc، ضرایب پارکور، ضرایب کپسترام، فرمنتها و فرکانس گام را به عنوان ویژگیهای لازم درنظر گرفته ایم . خطای الگوریتم برای 10 گوینده و 10 تکرار جمله "من کد رمز را نمی دانم" 2 بوده است .