شناسایی خودکار زبان گفتار با استفاده از روش های آماری

پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی برق
نویسنده علی ضیایی
استاد راهنما محمد احدی
تعداد صفحات: ۱۵ صفحه ی اول
سال انتشار 1387

چکیده

سیستم های شناسایی زبان بر دو گونه اند: سیستم هایی که از اطلاعات سطح بالای زبان مانند واج و کلمه برای شناسایی زبان استفاده می کنند و سیستم هایی که از اطلاعات سطح پایین زبان مثل زیرواج و یا ویژگی های طیفی گفتار استفاده می کنند. مشکل سیستم های با دقت بالا مانند سیستم های شناسایی زبان مبتنی بر واج که نیاز به استخراج واج دارند اینست که نیاز به دادگان آوانویسی شده برای آنها وجود دارد و با توجه به اینکه اینگونه دادگان برای همه زبان ها وجود ندارد، بنابراین این نوع سیستم ها به مشکل بر می خورند. ما در این پروژه سعی کرده ایم سیستم شناسایی زبانی طراحی کنیم که از ویژگی های سطح پایین زبانی مانند زیر واج ها و یا ویژگی های طیفی که بدون نظارت استخراج شده و نیاز به دادگان آوانویسی شده هم ندارند استفاده کند و دقتی بالاتر از سیستم های شناسایی زبان با پیچیدگی زیاد به ما بدهد. ما در این پایان نامه از یک کرنل دنباله ای جدید برای نگاشت خروجی مدل های زبانی سیستم شناسایی زبان مبتنی بر مدل های گوسی، به فضای جدیدی که زبان ها در آن فضا بیشترین جدایی پذیری را با هم دارند، استفاده کرده ایم. سپس این سیستم را با سیستم پایه gmm-lm که از مدل گوسی برای طبقه بندی کننده استفاده می کند، ترکیب کرده ایم.استفاده از کرنل پیشنهادی نسبت به کرنل دنباله ای glds به عنوان نگاشت دهنده خروجی های مدل های زبانی، باعث افزایش 2% راندمان سیستم gmm-lm در شناسایی زبان می گردد. همچنین سیستم ترکیبی ما که از ترکیب سیستم فوق و سیستم پایه gmm-lm تشکیل شده است، باعث افزایش 5% راندمان سیستم شناسایی زبان می گردد.

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

تولید خودکار نوای گفتار به کمک مدل آمیختار عصبی-آماری با امکان انتخاب واحد در سنتز

در این مقاله با هدف ایجاد بهبود در عملکرد اولین ویرایش از سیستم تبدیل متن به گفتار طبیعی ارایه شده برای زبان فارسی، که در آن از یک شبکه عصبی بازگشتی برای تولید همزمان عوامل نوای گفتار (الگوی فرکانس گام، دیرش، انرژی و درنگ) و نیز سنتزکننده «مدل هارمونیک + نویز» با دادگان تک واحدی از دو واجی ها، برای تولید گفتار استفاده شده بود، چگونگی به کارگیری یک مدل آمیختار عصبی- آماری برای...

متن کامل

حذف خودکار آرتیفکت چشمی از سیگنال های مغزی با استفاده از ویژگی های آماری و زمانی- فرکانسی مولفه های مستقل

مهمترین مشکل در بررسی و پردازش ثبت های الکتروآنسفالوگرام (EEG) حضور انواع سیگنال های ناخواسته (آرتیفکت ها) است که حذف آنها با روش تحلیل مولفه های مستقل از بهترین گزینه های ممکن است. هدف مساله تحلیل مولفه های مستقل جداسازی کور ترکیبی خطی از منابع مستقل است. با اعمال این روش روی سیگنال های مغزی آغشته به آرتیفکت، آرتیفکت ها به صورت مولفه های مستقلی استخراج می شوند. تشخیص خودکار مولفه های مستقل مرب...

متن کامل

تولید خودکار نوای گفتار به کمک مدل آمیختار عصبی-آماری با امکان انتخاب واحد در سنتز

متن کامل

بررسی آگاهی آسیب شناسان گفتار و زبان از روش های ارتباطی مکمل و جایگزین

زمینه و هدف ناتوانی در صحبت کردن، مانع برقراری ارتباط و باعث دوری فرد از جامعه خواهد شد. روش های ارتباطی مکمل و جایگزین ACC به عنوان راهکاری مناسب برای کمک به افراد دارای اختلالات شدید در درک و بیان گفتار، مطرح است. در این پژوهش، میزان آگاهی آسیب شناسان گفتار و زبان از این روش ها مورد بررسی قرار گرفت. روش بررسی آزمودنی های این پژوهش مقطعی و توصیفی، 25 آسیب شناس گفتار و زبان شاغل در مراکز درم...

متن کامل

تشخیص لهجه های زبان فارسی از روی سیگنال گفتار با استفاده از روش های استخراج ویژگی کارآمد و ترکیب طبقه بندها

Speech recognition has achieved great improvements recently. However, robustness is still one of the big problems, e.g. performance of recognition fluctuates sharply depending on the speaker, especially when the speaker has strong accent and difference Accents dramatically decrease the accuracy of an ASR system. In this paper we apply three new methods of feature extraction including Spectral C...

متن کامل

آنالیز داده های ژل های الکتروفورز دو بعدی با استفاده از روش های آماری چند متغیره

سابقه و هدف : در سـال های اخیـر تکنولـوژی مـربوط به تـوصــیف لکه های پروتئینی نمایان شده بر ژل های الکتروفورز دو بعدی، توسعه ی قابل ملاحظه ای یافته و نرم افزارهای متعدد آماری آنالیز ژل نیز ایجاد و گسترش یافته است که تأثیر این ابتکارات بر ارتقاء پروتئومیک بسیار چشمگیر است.آنالیز داده های عظیم پروتئومیکی با دارا بودن متغیر های زیاد نیاز به روش های چند متغیره است که امکان آنالیز آماری همزمان چندین...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}

نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی برق

کلمات کلیدی

شناسایی(سیستم کنترل) identification (control system) زبان language دنباله sequence منحنی گوسی gaussian curve گفتار speech تجهیزات گفتارشناسی speech recognition equipment خودکارسازی automation کنترل برداری ماشین

میزبانی شده توسط پلتفرم ابری doprax.com