بررسی و بکارگیری ویژگیهای مقاوم در بازشناسی گفتار

پایان نامه
  • وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی
  • نویسنده آرش محمدی
  • استاد راهنما فرشاد الماس گنج
  • تعداد صفحات: ۱۵ صفحه ی اول
  • سال انتشار 1386
چکیده

با رشد روزافزون سیستمهای بازشناسی خودکار گفتار و گسترش کاربرد سیستمهای فوق در کاربردهای عملی و محیطهای واقعی مبحث بازشناسی گفتار به بستر اصلی تحقیقات دانشگاهی در زمینه پردازش گفتار بدل شده است. مقاوم سازی سیستمهای خودکار بازشناسی گفتار در برابر نویز امری ضروری جهت استفاده از چنین سیستمهایی در محیطهای واقعی است. در این پایان نامه مقاوم سازی بازشناسی گفتار پیوسته در سطح واج در حوزه بازنمایی بستر تحقیقات قرار گرفت و جهت نیل به این هدف از روش ویژگیهای از دست رفته در حوزه بازنمایی استفاده شده است. در روش مورد بررسی ابتدا به هر کدام از اجزاء اسپکتروگرام سیگنال نویزی با توجه به تخریب ناشی از نویز برچسب قابل اعتماد و غیرقابل اعتماد زده می شود و اجزایی که برچسب غیرقابل اعتماد خورده اند از نمایش حذف می شوند. با توجه به افزونگی ذاتی اطلاعات در سیگنال گفتار می توان انتظار داشت که در دقت بازشناسی با استفاده از اجزای باقیمانده و غیرنویزی بهبود حاصل شود. دو رویکرد برای برخورد با اسپکتروگرام ناقص مطرح است: رویکرد ناقص پیش از بازشناسی و استفاده از مدلهای معمول است که در این پایان نامه رویکرد دوم مورد بررسی قرار گرفته است. مساله اصلی در رویکرد دوم چگونگی بازسازی ویژگیهای از دست رفته با استفاده از ویژگیهای قابل اعتماد است. جهت بازسازی پس از پیاده سازی الگوریتمهای پیشنهادی در کارهای پیشین سه ایده جدید ارایه گردید. نخست استفاده از ویژگیهای قابل اعتماد است. جهت بازسازی پس از پیاده سازی الگوریتمهای پیشنهادی در کارهای پیشین سه ایده جدید ارایه گردید. نخست استفاده از خوشه بندی آوایی جهت بهبود روش خوشه بندی معمولی. مدل سازی بردارهای طیفی با استفاده از توزیع لاپلاس و تخمین ویژگیهای از دست رفته بااستفاده از پارامترهای توزیع لاپلاس ایده دوم این پایان نامه بوده و در نهایت سومین ایده بهره گیری از همبستگی های زمانی جهت بازسازی اسپکتروگرام ناقص با استفاده از کالمن فیلتر می باشد.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

مقاوم سازی سیستم بازشناسی گفتار پیوسته

دقت سیستم¬های بازشناسی گفتار در محیط¬های آزمایشگاهی و کنترل شده به میزان قابل قبولی افزایش یافته و امروزه شاهد استفاده از این سیستم¬ها در محیط¬های واقعی هستیم. با این حال، کارایی این سیستم¬ها در حضور نویز به دلیل عدم تطابق بین شرایط و محیط آموزشی و آزمون به شدت افت می¬کند. علاوه بر این، تنوع مشخصه¬های گفتاری گویندگان نیز بر کارایی این سیستم¬ها تاثیرگذار است. در سال¬های اخیر، عمده پژوهش¬های صورت...

روشی جدید در بازشناسی مقاوم گفتار مبتنی بر دادگان مفقود با استفاده از شبکه عصبی دوسویه

Performance of speech recognition systems is greatly reduced when speech corrupted by noise. One common method for robust speech recognition systems is missing feature methods. In this way, the components in time - frequency representation of signal (Spectrogram) that present low signal to noise ratio (SNR), are tagged as missing and deleted then replaced by remained components and statistical ...

متن کامل

مقاوم سازی بازشناسی گفتار با اعمال پردازش زیرباندی

در این پروژه مقاوم سازی بازشناسی گفتار در محیط های نویزی بر مبنای پردازش زیرباندی بررسی شده است. مقاوم سازی بازشناسی گفتار یکی از مسائل مهم در این حوزه می باشد که کار بر روی ان همچنان ادامه دارد. از روش های گوناگونی به منظور تحقق یافتن این مهم استفاده می شود و ایده های متنوعی نیز در مقالات و تحقیقات ارائه می گردند. عیب عمده اکثر روشهای پیشهاد شده پیچیدگی زیاد و سرعت کم الگوریتم های آن است. ما د...

15 صفحه اول

مقاوم سازی بازشناسی گفتار برمبنای سیستم شنیداری انسان

در این پایان نامه، یک الگوریتم استخراج ویژگی جدید را معرفی می کنیم که pncc نامیده می شود و مبتنی بر سیستم شنیداری انسان می باشد. ویژگیهای جدید pncc شامل یک غیر خطی قانون توان است که جایگزین غیر خطی لگاریتمی استفاده شده در mfcc شده است، و همچنین شامل یک الگوریتم جدید برای حذف تحریک پس زمینه-با استفاده از تخمین توان با طول متوسط مبتنی بر نسبت میانگین حسابی به میانگین هندسی-و همچنین کاهش توان پس ز...

15 صفحه اول

پایه‌گذاری بستری نو و کارآمد در حوزه بازشناسی گفتار فارسی

Although researches in the field of Persian speech recognition  claim  a  thirty-year-old  history in Iran  which has achieved considerable progresses, due to the lack of well-defined experimental framework, outcomes from many of these researches are not comparable to each other and their accurate assessment won’t be possible. The experimental framework includes ASR toolkit and speech database ...

متن کامل

بازشناسی گفتار احساسی و شناسایی حالت گفتار در زبان فارسی

حالت گفتار سبب افزودن اطلاعات اضافی نسبت به اطلاعات نوشتاری می شود. از طرف دیگر، وجود حالت در گفتار سبب بروز مشکل در فرایند بازشناسی گفتار می شود. در تحقیقات قبلی نشان داده شد که حالت گفتار سبب تغییرات اساسی در پارامترهای گفتاری می شود. برای بهبود نتایج بازشناسی گفتار با حالت، ابتدا باید تأثیر آن را بر پارامترهای گفتاری به دست آورد و در مرحله بعدی، از پارامترهای مناسبی برای بهبود نتایج بازشناسی...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023