استخراج ویژگی‌های مبتنی بر مدل‌سازی خطی تراژکتوری گفتار جاسازی شده در فضای بازسازی شده فاز برای سیستم بازشناسی گفتار

نویسندگان

  • فرشاد الماس‌گنج دانشیار، گروه بیوالکتریک، دانشکده مهندسی‌ پزشکی، دانشگاه صنعتی امیرکبیر (پلی‌تکنیک ایران)
  • یاسر شکفته دانشجوی دکتری مهندسی پزشکی، گروه بیوالکتریک، دانشکده مهندسی‌ پزشکی، دانشگاه صنعتی امیرکبیر (پلی‌تکنیک ایران)
چکیده مقاله:

تحقیقات اخیر نشان می‌دهد که تظاهرات غیرخطی و آشوبی سیگنال گفتار می‌تواند در حوزة فضای بازسازی شده فاز (RPS) مطالعه شود. تئوری جاسازی برمبنای محورهای تأخیری، ابزار مناسبی برای بررسی تراژکتورهای گفتاری در RPS است. تاکنون از مشخصه‌های تراژکتورهای گفتاری به ندرت در سیستم‌های کاربردی بازشناسی گفتار استفاده شده است. از اینرو در این مقاله  روش استخراج ویژگی جدیدی براساس پارامترهای مدلسازی خطی مبتنی بر روش AR برداری (VAR) پیشنهاد شده است. در این روش بوسیله ماتریس ضرایب فیلتر و یا ضرایب انعکاسی به دست آمده از اعمال روش VAR بر مشخصه‌های استاتیک و دینامیک تراژکتوری های گفتاری شکل یافته در RPS، یک بردار ویژگی با بُعد زیاد حاصل می‌شود که می‌توان از روش‌های نگاشت خطی برای کاهش بُعد مناسب آن استفاده کرد. نتایج آزمایش‌های بازشناسی واج مجزا و پیوسته بر مجموعه دادگان گفتاری فارس‌دات نشان می‌دهد که کارایی این روش در مقایسه با دیگر روش‌های متداول استخراج ویژگی مبتنی بر حوزة زمان مانند روش LPC و LPREF بیشتر است. 

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

استخراج ویژگی های مبتنی بر مدل سازی خطی تراژکتوری گفتار جاسازی شده در فضای بازسازی شده فاز برای سیستم بازشناسی گفتار

تحقیقات اخیر نشان می دهد که تظاهرات غیرخطی و آشوبی سیگنال گفتار می تواند در حوزة فضای بازسازی شده فاز (rps) مطالعه شود. تئوری جاسازی برمبنای محورهای تأخیری، ابزار مناسبی برای بررسی تراژکتورهای گفتاری در rps است. تاکنون از مشخصه های تراژکتورهای گفتاری به ندرت در سیستم های کاربردی بازشناسی گفتار استفاده شده است. از اینرو در این مقاله  روش استخراج ویژگی جدیدی براساس پارامترهای مدلسازی خطی مبتنی بر...

متن کامل

بهبود عملکرد سیستم بازشناسی گفتار پیوسته بوسیله ویژگی‌های استخراج شده از مانیفولدهای گفتاری در فضای بازسازی شده فاز

The design for new feature extraction methods out of the speech signal and combination of their obtained information is one of the most effective approaches to improve the performance of automatic speech recognition (ASR) system. Recent researches have been shown that the speech signal contains nonlinear and chaotic properties, but the effects of these properties are not used in the continuous ...

متن کامل

اثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین

Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...

متن کامل

اثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین

Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...

متن کامل

مدل سازی غیرخطی قطع پوانکاره سیگنال گفتار در ترکیب با تحلیل حوزه فرکانس به منظور افزایش صحت عملکرد سیستمهای بازشناسی گفتار

در این مقاله روشی جدید برای افزایش صحت سیستمهای بازشناسی گفتار، با استفاده از ترکیب بردارهای ویژگی به دست آمده از مدل سازی غیرخطی فضای فاز بازسازی شده سیگنال گفتار با ویژگیهای معمول به دست آمده از تحلیل حوزه فرکانس ارائه می شود. بر اساس نظریه پذیرفته شده کنونی، در صورت انتخاب تعداد بُعد کافی برای بازسازی فضای فاز سیگنال، این فضا به صورت کامل دینامیک سیستم تولید کننده آن را نشان می دهد و بنابراین...

متن کامل

شبکه عصبی پیچشی با پنجره‌های قابل تطبیق برای بازشناسی گفتار

Although, speech recognition systems are widely used and their accuracies are continuously increased, there is a considerable performance gap between their accuracies and human recognition ability. This is partially due to high speaker variations in speech signal. Deep neural networks are among the best tools for acoustic modeling. Recently, using hybrid deep neural network and hidden Markov mo...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


عنوان ژورنال

دوره 6  شماره 1

صفحات  17- 33

تاریخ انتشار 2012-05-21

با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023