بازشناخت مقاوم گفتار فارسی با استفاده از ضرایب مل-کپستروم بهبودیافته و شبکه عصبی

پایان نامه
چکیده

ضرایب مل-کپستروم یکی از فراگیرترین ویژگی های مورد استفاده در کاربردهای بازشناسی گفتار است.مشکل عمده در به کارگیری این ضرایب آسیب پذیری و حساسیت بالای آن ها در محیط های نویزی می باشد.در این ژایان نامه یک روش مقاوم در برابر نویز، جهت استخراج ویژگی ضرایب مل-کپستروم معرفی شده است.اساس تغییرات اعمال شده در الگوریتم پیشنهادی عبارتند از : به کار بردن تفریق میانگین سیگنال به ترتیب در حوزه های زمان و فرکانس ،استفاده از تابع خودهمبستگی و حذف ضرایب مرتبه پایین ،تغییر پنجره ی مورد استفاده در مرحله ی پنجره بندی گفتار،استفاده از فیلتر های مناسب جهت حذف نویز کانولوشن ،استفاده از فیلتر بانک گوسی به جای فیلتر بانک مثلثی،افزودن بلوک های جبرانگر به تابع لگاریتم جهت بالا بردن مصونیت این بخش آسیب پذیر از الگوریتم. جهت ارزیابی عملکرد الگوریتم پیشنهادی و همچنین طبقه بندی نتایج، از یک شبکه عصبی پرسپترون چند لایه استفاده شده است. نتایج آزمایش های تشخیص گفتار فارسی در نرخ سیگنال به نویزهای متفاوت، نشان گر افزایش معنادار نرخ تشخیص در محیط نویزی و نیز مصونیت بیشتر الگوریتم پیشنهادی نسبت به الگوریتم پایه و همچنین برخی از الگوریتم های مطرح در این خانواده است. .

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

روشی جدید در بازشناسی مقاوم گفتار مبتنی بر دادگان مفقود با استفاده از شبکه عصبی دوسویه

Performance of speech recognition systems is greatly reduced when speech corrupted by noise. One common method for robust speech recognition systems is missing feature methods. In this way, the components in time - frequency representation of signal (Spectrogram) that present low signal to noise ratio (SNR), are tagged as missing and deleted then replaced by remained components and statistical ...

متن کامل

بازشناسی مقاوم گفتار با استفاده از ویژگی‌ الگوهای زمانی به دست آمده از ساختار شبکه عصبی بهینه شده MTMLP

ویژگی‌ الگوهای زمانی سیگنال صوتی از دو حوزه زمانی و یا بردارهای بازنمایی شده قابل استخراج است. این ویژگی دربرگیرنده اطلاعات و مشخصات زمان بلند از تغییرات پیوسته واحدهای گفتاری است. در این مقاله، ویژگی الگوهای زمانی با استفاده از خروجی مقدار احتمال پسین واجی ساختار بهینه شده شبکه عصبی MTMLP، از مجموعه بردارهای بازنمایی مبتنی بر طیف (مانند ویژگی گفتاری‌ LFBE) و همچنین، مبتنی بر کپستروم (مانند ویژ...

متن کامل

تقطیع هجایی گفتار پیوسته فارسی با استفاده از آستانه‌گذاری ضرایب موجک و نرم‌سازی فازیِ تابع انرژی

امروزه در تحقیقات حوزه پردازش و بازشناخت گفتار، هجا به دلیل ارتباط قوی آن با تولید و ادراک گفتار در انسان، به عنوان یک واحد زیرکلمه‌ای هر روز بیشتر مورد توجه قرار می‌گیرد. آشکارسازی خودکار مرزهای هجایی گامی مهم در تحقیقات مرتبط با نوای گفتار، تولید گفتار طبیعی و حتی بازشناسی گفتار است. در این مقاله روش جدیدی برای آشکارسازی خودکار مرزهای هجایی در سیگنال گفتار پیوسته فارسی با تکیه بر اطلاعات صوتی...

متن کامل

تقطیع هجایی گفتار پیوسته فارسی با استفاده از آستانه‌گذاری ضرایب موجک و نرم‌سازی فازیِ تابع انرژی

امروزه در تحقیقات حوزه پردازش و بازشناخت گفتار، هجا به دلیل ارتباط قوی آن با تولید و ادراک گفتار در انسان، به عنوان یک واحد زیرکلمه‌ای هر روز بیشتر مورد توجه قرار می‌گیرد. آشکارسازی خودکار مرزهای هجایی گامی مهم در تحقیقات مرتبط با نوای گفتار، تولید گفتار طبیعی و حتی بازشناسی گفتار است. در این مقاله روش جدیدی برای آشکارسازی خودکار مرزهای هجایی در سیگنال گفتار پیوسته فارسی با تکیه بر اطلاعات صوتی...

متن کامل

بازشناخت مقاوم الگوها با استفاده از شبکه های عصبی با جاذب های پیوسته

به کارگیری دینامیک های جاذب نقطه ای به عنوان حافظه های انجمنی به دهه ی هشتاد میلادی و معرفی شبکه ی هاپفیلد باز می گردد بازیابی حافظه در این سیستم ها با استفاده از شبکه های بازگشتی صورت می گیرد. در کنار این دینامیک های جاذب وجود فعالیت ماندگار در سلول های مغز به همراه ساختارهای بازگشتی در نواحی قشری مغز، ما را به سمت تکامل دینامیک های جدیدتری به نام شبکه های عصبی یا جاذب های پیوسته سوق می دهد. د...

15 صفحه اول

نقشه برداری ویژگی با استفاده از شبکه باور عمیق برای تشخیص گفتار قوی

کارآیی سیستمهای بازشناسی گفتار خودکار در شرایط نویزی بخاطر عدم تطابق میان شرایط اموزش و آزمایش به شدت کاهش می یابد. روشهای متعدی برای رفع این عدم تطابق پیشنهاد شده اند. در سالهای اخیر شبکه های عصبی عمیق به طرز گسترده ای در سیستمهای بازشناسی گفتار و نیز در مقاوم سازی آنها و استخراج ویژگیهای مقاوم گفتار مورد استفاده قرار گرفته اند. در این مقاله، پیشنهاد می شود که از شبکه باور عمیق به عنوان یک ررو...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود - دانشکده برق و کامپیوتر

کلمات کلیدی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023