نام پژوهشگر: عاطفه دهقانیان

کاربرد روش استخراج ویژگی rootmel جهت تخمین سن افراد با استفاده از سیگنال گفتار
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود - دانشکده برق 1391
  عاطفه دهقانیان   حسین مروی

تخمین سن بر اساس ویژگی های گفتار انسان، یک موضوع قابل توجه در سیستم های شناسایی گفتار اتوماتیک می باشد. مطالعاتی در زمینه ی تخمین سن گوینده صورت گرفته است ولی نیاز به کار های نوین بیشتری، خصوصا برای گوینده های فارسی زبان، می باشد. در تخمین سن، مانند سایر سیستم های پردازش گفتار، با دو چالش مهم مواجه هستیم: یافتن یک روش مناسب برای استخراج ویژگی و انتخاب یک روش قابل اطمینان برای کلاسه بندی. هدف اصلی از این تحقیق استفاده از ویژگی root mel ferequency cepstral coefficients جهت بخش استخراج ویژگی در یک سیستم تخمین سن و یافتن بهترین مقدار برای داشتن درصد خطای کمتر می باشد؛ و همچنین مقایسه ی عملکرد این ویژگی با سایر ویژگی های متداول نظیر mfcc معمول، plp و lpc نیز مورد بررسی قرار گرفته است . برای استخراج ویژگی، کل سیگنال صوت را به کوچک ترین جزء آن، یعنی واج ها، تفکیک می کنیم و عملیات استخراج ویژگی و رده بندی را بر سیگنال مربوط به واج ها انجام می دهیم. از کلاسه بند به روش های تفکیک پذیری خطی و فواصل mahalanobis استفاده شده است. نتیجه آزمایشات انجام شده بر پایگاه داده ی farsdat به خطای کمترین 28.69 % بازای ریشه ی 0.006 در استفاده از روش rootmfcc و تاثیر مثبت تفکیک سیگنال صوتی به واج های تشکیل دهنده ی آن، در کاهش خطا می باشد.