تخمین سریع ضرایب پیچش در هنجارسازی طول مجرای صوتی با استفاده از امتیاز به دست آمده از مدلسازی تشخیص جنسیت

نویسندگان

  • رضا, شقایق پژوهشگاه توسعه فناوری های پیشرفته خواجه نصیرالدین طوسی
  • شکفته, یاسر پژوهشگاه توسعه فناوری های پیشرفته خواجه نصیرالدین طوسی
  • قلی پور, حسن پژوهشگاه توسعه فناوری های پیشرفته خواجه نصیرالدین طوسی
چکیده مقاله:

The performance of automatic speech recognition (ASR) systems is adversely affected by the variations in speakers, audio channels and environmental conditions. Making these systems robust to these variations is still a big challenge. One of the main sources of variations in the speakers is the differences between their Vocal Tract Length (VTL). Vocal Tract Length Normalization (VTLN) is an effective method introduced to cope with this variation. In this method, the speech spectrum of each speaker is frequency warped according to a specific warping factor of that speaker. In this paper, we first developed the common search-based method to obtain the appropriate warping factor over a HMM-based Persian continuous speech recognition system. Then pointing out the computational cost of search-based method, we proposed a linear regression process for estimating warping factor based on the scores generated by our gender detection system. Experimental results over a Persian conversational speech database shown an improvement about 0.54 percent in word recognition accuracy as well as a significant reduction in computational cost of estimating warping factor, compared to search-based approach.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

بررسی اثر استفاده از روش تطبیق هنجارسازی طول مسیر صوتی به منظور تشخیص اختلالات گفتاری رایج و گفتاردرمانی کودکان فارسی زبان

در این مقاله، یک سیستم بازشناسی کلمات جداگانه بررسی شده است. هدف این تحقیق، افزایش کارایی سیستم بازشناسی گفتار کودکان با استفاده از روش هنجارسازی طول مسیر صوتی است. این سیستم بازشناسی، برای استفاده در طراحی نرم‌افزار گفتاردرمانی ایجاد شده است به طوری که این نرم‌افزار با استفاده از سیستم بازشناسی، درست یا نادرست بودن تلفظ کودک را تشخیص می‌دهد و تلاش می‌کند تا با استفاده از بازخور...

متن کامل

بررسی اثر استفاده از روش تطبیق هنجارسازی طول مسیر صوتی به منظور تشخیص اختلالات گفتاری رایج و گفتاردرمانی کودکان فارسی زبان

در این مقاله، یک سیستم بازشناسی کلمات جداگانه بررسی شده است. هدف این تحقیق، افزایش کارایی سیستم بازشناسی گفتار کودکان با استفاده از روش هنجارسازی طول مسیر صوتی است. این سیستم بازشناسی، برای استفاده در طراحی نرم­افزار گفتاردرمانی ایجاد شده است به طوری که این نرم­افزار با استفاده از سیستم بازشناسی، درست یا نادرست بودن تلفظ کودک را تشخیص می­دهد و تلاش می­کند تا با استفاده از بازخوردها گفتار کودک ر...

متن کامل

اثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین

Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...

متن کامل

اثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین

Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...

متن کامل

تخمین تراوایی مخازن گازی کربناته با استفاده از نگارِ تشدید مغناطیسی هسته‌ای (NMR) و شاخص زون جریانی به دست آمده از امواج استونلی (FZI- استونلی)

تراوایی یکی از مهمترین پارامتراهای مخزنی برای توسعه و گسترش مخزن می باشد که نشان دهنده قابلیت سنگ مخزن در انتقال سیال هاست. به علت ناهمگن بودن مخزن، تخمین تراوایی همیشه با خطای زیادی محاسبه می شود. برای محاسبه تراوایی، این مقاله به دو بخش کلی تقسیم شده است. در بخش اول، با استفاده از نگاره تشدید مغناطیسی هسته ای ((NMR گروه‌های آرامش (معادل واحدهای جریان هیدرولیکی 12b0 یا HFU) تعیین شدند. مزیت...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


عنوان ژورنال

دوره 13  شماره 1

صفحات  57- 70

تاریخ انتشار 2016-06

با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.

کلمات کلیدی

کلمات کلیدی برای این مقاله ارائه نشده است

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023