سنتز جملات فارسی با استفاده از قواعد گویشی و کسره بین کلمات

پایان نامه
چکیده

با پیشرفت چشمگیر علوم رایانه در چند دهه ی اخیر و پررنگ تر شدن نقش آن در زندگی بشر، علوم مختلفی در کنار آن بوجود آمده و رشد کرده اند. یکی از این علوم هوش مصنوعی است و خود نیز به شاخه های متعددی تقسیم می شود که یکی از آن ها پردازش زبان طبیعی است. از شاخه های پردازش زبان طبیعی می توان به تبدیل متن به گفتار اشاره کرد که بیش از پنج دهه بر روی این موضوع کار شده است. در تبدیل متن به گفتار، هدف این است که رایانه قادر باشد تا یک متن را با صدای طبیعی –صدای انسان- بخواند. بدین منظور دو کار باید صورت گیرد: پردازش متن، سنتز گفتار. حدود دو دهه است که زبان فارسی نیز در پردازش رایانه ای مورد توجه قرار گرفته است. برای سنتز گفتار، از سه روش عمده استفاده می شود. روش اول که سعی در مدل سازی دقیق سیستم تولید گفتار انسان دارد، روش دوم که براساس استفاده از فیلترهای سری-موازی برای مدل کردن آواها بنا شده است و روش سوم که از قطعات از پیش ضبط شده استفاده می کند. آزمایشات نشان داده است که روش سوم، گفتار طبیعی تری تولید می کند. هدف از این پایان نامه، تولید گفتار طبیعی در زبان فارسی، با توجه به این سه موضوع است: تکیه ی کلمات، آهنگ جملات و کسره ی اضافه. در روش پیشنهادی، سنتز گفتار بر اساس استفاده از قطعات از پیش ضبط شده به نام دایفون است که دلایل استفاده از آن نیز مطرح شده است. ابتدا با توجه به بحث های زبان شناسی، نقش کلمات در جملات تعیین می گردد و با کمک آن، نوع کلمه مشخص می شود و با دانستن نوع کلمه، جایگاه تکیه در آن استخراج می گردد. سپس نوع جملات مشخص شده و با توجه به آن آهنگ جملات تعیین می شود. همچنین باید جایگاه کسره های اضافه در متن نیز مشخص گردد. با توجه به این مطالب، دایفون ها در هفت حالت استخراج می شوند و در زمان سنتز گفتار، با توجه به تکیه ی کلمات و آهنگ جملات و مکان کسره ی اضافه کنار هم قرار می گیرند. بررسی نتایج نشان می دهد از آن جا که آهنگ جملات و تکیه کلمات و پیوستگی در مکان های کسره ی اضافه، درون قطعات از پیش ضبط شده –دایفون ها- موجود است، استفاده از این روش نوای گفتار طبیعی تری نسبت به برخی سیستم های موجود، تولید می کند. معیار مقایسه نیز mos بوده است که این مقدار در روش پیشنهادی برای طبیعی بودن و اعمال نوای گفتار در چند حالت مختلفی که بررسی شده است، حدود 4.5 به دست آمده است.

برای دانلود 15 صفحه اول ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

شناسایی کسره اضافه در متون فارسی برای استفاده در سیستم های تبدیل متن به گفتار

این تحقیق به شناسایی کسره اضافه در متون فارسی اختصاص دارد. روشهای مورد استفاده برای شناسایی کسره اضافه باید به گونه ای باشند که بتوانند بدون محدودیت در کلیه متون مورد استفاده قرار گیرند. همچنین در هنگام تشخیص دارای سرعت مناسبی نیز باشد. برای آموزش و تست روشهای ارایه شده در این تحقیق از پیکره زبان فارسی تهیه شده توسط پژوهشگاه هوشمند علایم استفاده گردیده استکه برای بخش تست آن از 1000 متن این پیکر...

15 صفحه اول

کسرۀ بدل از یای نکره، یک ویژگی گویشی ـ رسم‌الخطی

در مقالۀ پیش رو به گرد‌آوری شواهد کاربرد کسره به‌جای یای نکره (گاه، یای انشاء) می‌پردازیم و می‌کوشیم که چگونگی ایجاد این خصوصیت در برخی متون، محدودۀ زمانی و مکانی این ویژگی و تأثیرات احتمالی آن در دستور زبان را بررسی کنیم. عوامل مختلفی در شکل‌گیری این ویژگی مؤثر بوده‌اند و ما آن را یک ویژگی‌ گویشی  ـ ‌ رسم‌الخطی می‌دانیم. در بررسی فرایند ایجاد این پدیده، برخی خصایص رسم‌الخطی دست‌نویس‌های زبان ف...

متن کامل

استفاده از واژه های اضافی در ساختار جملات مرکب شفاهی

صرفه جویی در کاربرد کلمات و جلوگیری از تکرار کلمات مربوط به تمام سطوح زبانی می شود. در مقاله سعی شده اشکال مختلف استفاده از کلمات اضافی و تکرار کلمات در جملات مرکب شفاهی مورد بررسی قرار گیرد. همچنین موارد مربوط به نحو و ساختار جملات در گفتار ونیز موارد مربوط به ارتباطات معنایی کلمات مورد بررسی قرار می گیرد. استفاده از کلمات اضافی قواعد مربوط به جملات کتبی را نقض می کند. ولیکن استفاده از کلمات ا...

متن کامل

نشان گرهای زبانی ساخت های کذب در فارسی: یک پژوهش زبانی ـ اجتماعی

هدف اصلی پژوهش حاضر بررسی و تحلیل ساخت های دروغ در زبان فارسی است و در این راستا، به بررسی رابطۀ بین میزان استفاده از «نشان گرهای احتیاط»، «نشان گرهای نفی»، «کلمات حسی»، «کلمات مجزاگر» و «ضمایر» با کذب جملات پرداخته شده است. این پژوهش با روش توصیفی ـ تحلیلی در یک جامعۀ آماری فارسی زبان شامل 28 نفر مرد و زن و در دو گروه سنی به انجام رسیده و برای نشان دادن معناداری ارقام از آزمون های ضریب همبستگی...

متن کامل

نشان‌گرهای زبانی‌ ساخت‌های کذب در فارسی: یک پژوهش زبانی ـ اجتماعی

هدف اصلی پژوهش حاضر بررسی و تحلیل ساخت‌های دروغ در زبان فارسی است و در این راستا، به بررسی رابطۀ بین میزان استفاده از «نشان‌گرهای احتیاط»، «نشان‌گرهای نفی»، «کلمات حسی»، «کلمات مجزاگر» و «ضمایر» با کذب جملات پرداخته ‌شده است. این پژوهش با روش توصیفی ـ تحلیلی در یک جامعۀ آماری فارسی‌زبان شامل 28 نفر مرد و زن و در دو گروه سنی به انجام رسیده و برای نشان دادن معناداری ارقام از آزمون‌های ضریب همبستگ...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی راحت تر خواهید کرد

دانلود 15 صفحه اول

برای دانلود 15 صفحه اول ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

پست های جدید
{@ post.title @}
{@ post.author_name @} {@ post.publish_date|hmn @}

{@ post.summary|truncate @}