سنتز جملات فارسی با استفاده از قواعد گویشی و کسره بین کلمات

پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه سمنان - دانشکده برق و کامپیوتر
نویسنده محمدصادق رستمی
استاد راهنما سعید مظفری خشایار یغمایی
تعداد صفحات: ۱۵ صفحه ی اول
سال انتشار 1391

چکیده

با پیشرفت چشمگیر علوم رایانه در چند دهه ی اخیر و پررنگ تر شدن نقش آن در زندگی بشر، علوم مختلفی در کنار آن بوجود آمده و رشد کرده اند. یکی از این علوم هوش مصنوعی است و خود نیز به شاخه های متعددی تقسیم می شود که یکی از آن ها پردازش زبان طبیعی است. از شاخه های پردازش زبان طبیعی می توان به تبدیل متن به گفتار اشاره کرد که بیش از پنج دهه بر روی این موضوع کار شده است. در تبدیل متن به گفتار، هدف این است که رایانه قادر باشد تا یک متن را با صدای طبیعی –صدای انسان- بخواند. بدین منظور دو کار باید صورت گیرد: پردازش متن، سنتز گفتار. حدود دو دهه است که زبان فارسی نیز در پردازش رایانه ای مورد توجه قرار گرفته است. برای سنتز گفتار، از سه روش عمده استفاده می شود. روش اول که سعی در مدل سازی دقیق سیستم تولید گفتار انسان دارد، روش دوم که براساس استفاده از فیلترهای سری-موازی برای مدل کردن آواها بنا شده است و روش سوم که از قطعات از پیش ضبط شده استفاده می کند. آزمایشات نشان داده است که روش سوم، گفتار طبیعی تری تولید می کند. هدف از این پایان نامه، تولید گفتار طبیعی در زبان فارسی، با توجه به این سه موضوع است: تکیه ی کلمات، آهنگ جملات و کسره ی اضافه. در روش پیشنهادی، سنتز گفتار بر اساس استفاده از قطعات از پیش ضبط شده به نام دایفون است که دلایل استفاده از آن نیز مطرح شده است. ابتدا با توجه به بحث های زبان شناسی، نقش کلمات در جملات تعیین می گردد و با کمک آن، نوع کلمه مشخص می شود و با دانستن نوع کلمه، جایگاه تکیه در آن استخراج می گردد. سپس نوع جملات مشخص شده و با توجه به آن آهنگ جملات تعیین می شود. همچنین باید جایگاه کسره های اضافه در متن نیز مشخص گردد. با توجه به این مطالب، دایفون ها در هفت حالت استخراج می شوند و در زمان سنتز گفتار، با توجه به تکیه ی کلمات و آهنگ جملات و مکان کسره ی اضافه کنار هم قرار می گیرند. بررسی نتایج نشان می دهد از آن جا که آهنگ جملات و تکیه کلمات و پیوستگی در مکان های کسره ی اضافه، درون قطعات از پیش ضبط شده –دایفون ها- موجود است، استفاده از این روش نوای گفتار طبیعی تری نسبت به برخی سیستم های موجود، تولید می کند. معیار مقایسه نیز mos بوده است که این مقدار در روش پیشنهادی برای طبیعی بودن و اعمال نوای گفتار در چند حالت مختلفی که بررسی شده است، حدود 4.5 به دست آمده است.

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

بهبود شناسایی موجودیت‌های نامدار فارسی با استفاده از کسره اضافه

Named entity recognition is a process in which the people’s names, name of places (cities, countries, seas, etc.) and organizations (public and private companies, international institutions, etc.), date, currency and percentages in a text are identified. Named entity recognition plays an important role in many NLP tasks such as semantic role labeling, question answering, summarization, machine ...

متن کامل

قدرت کلمات، جملات و پاراگراف‌ها

متن کامل

تشخیص عادت های نوشتاری و استفاده از آن در سنتز کلمات در دستخط های فارسی

تولید کلمات در زبان فارسی و ساخت دستخط به کمک اتصال حروف دست نوشته، یکی از موضوعات جالب و کاربردی می باشد، به طوری که راهبردهای جدیدی را در زمینه تشخیص حروف دست نویس فارسی و همچنین تصدیق صحت دستخط افراد مختلف، مشخص می کند. در این مقاله به ساخت دستخط افراد از دستخط های قبلی آنها بر اساس اتصال حروف، پرداخته شده است. برای این منظور در ابتدا به کمک استخراج نقاط کنترلی حروف فارسی، برخی از عادت های ن...

متن کامل

ارائه خصیصه های خاص زبان فارسی جهت بازیابی و بازشناسی کلمات تصویری فارسی با استفاده از تعبیه برچسب

جستجو و بازیابی کلمات دستنویس در اسناد تصویری روشی جایگزین برای بازشناسی کاراکترهای نوری (OCR) است. این راهکار بیشتر در مواردی که بازشناسی کاراکترهای نوری دقت پایینی دارند، مانند متون دستنویس یا متون چاپی با کیفیت پایینی مطرح می‌گردد. امروزه یکی از روشهای کارآمد در بازیابی مبتنی بر محتوای تصویر، که برای کلمات تصویری هم توسعه داده شده است، استفاده از رده‌ بندی مبتنی بر خصیصه (Attribute-based Cla...

متن کامل

معنی‌شناسی جملات امری در فارسی

پژوهش حاضر، به تحلیل جملات امری از دیدگاه معنی‌شناسی صوری می‌پردازد. این جملات، افزون بر معنای «دستوری»، به‌عنوان یک نیروی منظوری پیش‌فرض، از طیف وسیعی از نیروهای منظوری دیگری نیز برخودارند. با توجّه به تعدّد معانی این ساخت در فارسی، در این مقاله کوشیده می‌شود به‌گونه‌ای نظام‌مند، به تبیین این نیروهای منظوری چندگانه پرداخته شود. بدین‌منظور، با بهره‌گیری از رویکرد «معنی‌شناسی جهان‌های ممکن» کراتزر...

متن کامل

The effect of cyclosporine on asymmetric antibodies and serum transforming growth factor beta1 in abortion-prone model of mice CBA/J x DBA/2

كچ ي هد فده و هقباس : ي ک ي طقس زورب للع زا اه ي ،ررکم ا لماوع تلاخد ي ژولونوم ي ک ا رد ي ن قم طققس عون ي وراد دقشاب ي س ي روپسولک ي ،ن ح لدم رد طقس شهاک بجوم ي ناو ي CBA/j×DBA/2 م ي تنآ ددرگ ي داب ي اه ي ان و راققتم TGF-β لماوع زا عت مهم يي ن گلماح تشونرس هدننک ي سررب روظنم هب رضاح هعلاطم تسا ي ات ث ي ر اس ي روپسولک ي ن م رب ي از ا ي ن تنآ عون ي داب ي س و اه ي اکوت ي ن TGF...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}

نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه سمنان - دانشکده برق و کامپیوتر

کلمات کلیدی

پردازش زبان طبیعی تبدیل متن به گفتار نوای گفتار دایفون

میزبانی شده توسط پلتفرم ابری doprax.com