بهبود ترجمه ماشینی آماری انگلیسی به فارسی با استفاده از اطلاعات زبانشناسی

پایان نامه
چکیده

با گسترش روز افزون حجم داده ها و اطلاعات و همچنین گسترش تعاملات بین المللی برقراری ارتباط یکی از مهمترین جنبه های زندگی امروز است. مشکل عمده ای که در این زمینه وجود دارد عدم امکان برقراری ارتباط با استفاده از داده های به زبان دیگر است. از اینرو یکی از مهمترین مسائل زندگی امروز ارائه راه حلی خودکار جهت ترجمه از یک زبان به زبان دیگر است. ترجمه ماشینی یکی از راه هایی است که برای حل این مشکل ارائه شده است و به خاطر اهمیت آن، در سالیان اخیر توجه بسیار زیادی به آن شده است. ترجمه ماشینی آماری به عنوان یکی از بهترین روش ها برای ترجمه از یک زبان به زبان دیگر شناخته می شود. برای زبان هایی که از لحاظ ساختار دارای شباهت زیادی به یکدیگر هستند خروجی این مترجم بسیار مناسب است. اما برای برخی جفت زبان ها مانند زبان های انگلیسی و فارسی تفاوت های ساختاری میان دو زبان و همچنین عدم وجود پیکره دوزبانه بزرگ باعث شده است که این روش برای ترجمه انگلیسی به فارسی ترجمه های مطلوبی را تولید نکند. در این پایان نامه سعی شده است با کمک گرفتن از اطلاعات زبان شناسی، تا حد ممکن بر مشکلات این روش برای ترجمه انگلیسی به فارسی فائق آید. جهت انجام این کار ابتدا سعی در کاهش تفاوت ساختاری میان جملات انگلیسی و فارسی شده است. این عمل می تواند منجر به ایجاد مدل ترجمه بهتر شود. برای این منظور یکسری قوانین استخراج و بر روی جملات انگلیسی اعمال گردید. این تغییرات منجر به بهبود حدود 17 درصدی در معیار bleu و حدود 21 درصدی در معیار nist گردیده است. در ادامه نسبت به غنی سازی عبارات داخل پیکره با استفاده از برخی اطلاعات زبان شناسی از جمله برچسب های بخش های سخن و ریشه کلمات اقدام شد. با این اطلاعات یک سیستم مترجم مبتنی بر فاکتور ایجاد گردید. خروجی این سیستم بهبود حدود 17 درصدی در معیار bleu و حدود 25 درصدی در معیار nist را نشان می دهد.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

تحلیل سیستم ترجمه ماشینی آماری فارسی- انگلیسی

این پایان نامه تلاشی است در جهت بررسی رویکرد جدید شاخه ترجمه ماشینی که از روش های آماری برای ساخت یک مترجم خودکار استفاده می کند. در فصل تجربیات ، ابتدا سیستم مترجم ماشینی آماری که برای جفت زبان فارسی-انگلیسی راه اندازی شده بهمراه خروجی این سیستم نشان داده شده است و پارامترهای آن مورد مطالعه قرار گرفته است. در ادامه به عنوان مطالعات جانبی اولین سیستم ترجمه آماری فارسی-آلمانی طراحی شده است. در ا...

15 صفحه اول

بازسازی ساختاری به منظور بهبود بخشیدن به ترجمه ماشینی آماری فارسی به انگلیسی

ترجمه خودکار از یک زبان طبیعی به زبان طبیعی دیگر با استفاده از کامپیوتر را ترجمه ماشینی می نامند. یکی از روشهایی که برای ترجمه از یک زبان به زبان دیگر بکار می رود، روش ترجمه ماشینی آماری است. از مشکلات اساسی در رابطه با ترجمه ماشینی آماری وجود نداشتن پیکره دو زبانه بزرگ است که منجر به دستیابی به خروجی هایی با کیفیت نامطلوب شده است. البته تنها با پیکره های دو زبانه نمی توان تمام ویژگی های زبانی ...

استفاده از تجزیه گرهای احتمالاتی زبان طبیعی جهت بهبود ترجمه افعال گروهی انگلیسی به فارسی

Machine translation of English sentences faces a big problem when it deals with phrasal verbs. Phrasal verb is a common structure occurring in English as a combination of a verb and a preposition, a verb and an adverb, or a verb with both an adverb and a preposition. Meaning of a phrasal verb is not compositional. The second part of the phrasal verbs which often is a preposition is called parti...

متن کامل

بررسی کیفیت ترجمه ماشینی متون انگلیسی به فارسی و میزان موفقیت آن در درک مطلب

هدف از این پژوهش بررسی تاثیر ترجمه ماشینی روی درک مطلب دانشجویان است. برای رسیدن به این هدف، سه نوع متن با سطوح مختلف دشواری انتخاب شد. این متون یک بار توسط مترجم انسانی و یک بار با ترجمه ماشینی (مترجم گوگل) ترجمه شد. در نهایت شش متن بدست آمد. خروجی ترجمه ماشینی مورد ارزیابی قرار گرفته و تجزیه و تحلیل شد. سپس دانشجویان به صورت تصادفی به شش گروه تقسیم شدند و هر گروه یکی از این متون را خوانده و ب...

متن کامل

ترجمه ماشینی انگلیسی به فارسی با استفاده از یک روش ترکیبی

با افزایش روزافزون حجم اطلاعات در دنیای امروز و آسان شدن برقراری ارتباط در سرتاسر دنیا توسط شبکه جهانی، اهمیت داشتن مترجم های خودکاری که بتوانند به صورت بلادرنگ و در عین حال دقیق، این اطلاعات را به زبان های مختلف آماده کنند، به شدت احساس می شود. این زمینه با ظهور ماشین های مترجم آماری جان تازه ای به خود گرفت. روش های ترکیبی ترجمه نیز در سالیان اخیر طرفداران بسیاری پیدا کرده است، خصوصاً برای ترجم...

15 صفحه اول

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023