بازسازی ساختاری به منظور بهبود بخشیدن به ترجمه ماشینی آماری فارسی به انگلیسی

پایان نامه
چکیده

ترجمه خودکار از یک زبان طبیعی به زبان طبیعی دیگر با استفاده از کامپیوتر را ترجمه ماشینی می نامند. یکی از روشهایی که برای ترجمه از یک زبان به زبان دیگر بکار می رود، روش ترجمه ماشینی آماری است. از مشکلات اساسی در رابطه با ترجمه ماشینی آماری وجود نداشتن پیکره دو زبانه بزرگ است که منجر به دستیابی به خروجی هایی با کیفیت نامطلوب شده است. البته تنها با پیکره های دو زبانه نمی توان تمام ویژگی های زبانی را بدست آورد و نیاز به عملیات زبان-شناسی در ترجمه آماری احساس می شود. فرایند بازسازی ساختاری به معنی تطبیق دادن ترتیب کلمات ترجمه شده به ترتیب کلمات در زبان مقصد است. به عنوان مثال می توان به تفاوت بین ترتیب موصوف-صفت در زبان فارسی و صفت-موصوف در زبان انگلیسی اشاره کرد. در این پایان نامه ابتدا به بررسی و مقایسه روش های بازسازی ساختاری که با هدف بهبود بخشیدن به کیفیت سیستم های ترجمه آماری انجام شده اند، پرداخته شده است. بازسازی های ساختاری که به صورت داخلی در سیستم های ترجمه آماری انجام می شوند محدود هستند و برای جفت زبان هایی که تفاوت های ساختاری زیادی با هم دارند به اندازه کافی مناسب نیستند. بنابراین نیاز به تکنیک های بیشتری در این زمینه احساس می-شود. روش پیشنهاد شده در این پایان نامه که برای جفت زبان های فارسی و انگلیسی طراحی شده است از ویژگی ها و قواعد زبانی استفاده می کند تا خروجی بهتری را در ترجمه از زبان فارسی به انگلیسی نتیجه دهد. در اولین گام در انجام روش پیشنهادی، قسمت فارسی پیکره دو زبانه با استفاده از برچسب گذار اجزای سخن، برچسب گذاری می شود. سپس با استفاده از تجزیه گر وابستگی برای زبان فارسی، روابط وابستگی بین کلمات در جملات قسمت فارسی پیکره نیز مشخص می شوند. برچسب گذارهای موجود برای زبان فارسی دارای دقت بسیار مناسبی هستند و از این نظر در کاهش کیفیت خروجی نهایی سیستم تاثیرگذاری منفی نخواهند داشت اما در مورد تجزیه گرهای زبان فارسی این مورد خیلی صحیح نیست و دقت تجزیه گرها در کیفیت خروجی سیستم تاثیرگذاری بیشتری خواهند داشت و از طرفی گستردگی تجزیه گرهای وابستگی برای زبان فارسی به اندازه برچسب گذارها نیست. بعد از برچسب گذاری و مشخص کردن روابط وابستگی میان کلمات، با توجه به تفاوت های زبان فارسی و انگلیسی، قواعدی استخراج می شوند تا پس از اعمال بر روی جمله های زبان مبدا (در اینجا زبان فارسی) ساختار این جملات را به ساختار زبان مقصد نزدیک تر کنند. قواعد بدست آمده به صورت یک سیستم پیش پردازشی عمل می کند که در نهایت بدون نیاز به ایجاد تغییر در قسمت های اصلی سیستم ترجمه ماشینی پایه، موجب بهبود کیفیت خروجی خواهد شد. بر اساس آزمایش های انجام شده برای بررسی کیفیت خروجی سیستم ترجمه حاصل با استفاده از سیستم های ارزیابی موجود، بهبود قابل قبولی نسبت به سیستم ترجمه ماشینی پایه بدست آمده است. روش انجام گرفته در این پایان نامه منجر به بهبودی در حدود 11/1 درصد در معیار ارزیابی بلو و مقدار 86/1 درصد در معیار f-measure شده است. همچنین در معیار ارزیابی ter کاهش 6/1 درصدی را مشاهده کرده ایم.

منابع مشابه

بهبود ترجمه ماشینی آماری انگلیسی به فارسی با استفاده از اطلاعات زبانشناسی

با گسترش روز افزون حجم داده ها و اطلاعات و همچنین گسترش تعاملات بین المللی برقراری ارتباط یکی از مهمترین جنبه های زندگی امروز است. مشکل عمده ای که در این زمینه وجود دارد عدم امکان برقراری ارتباط با استفاده از داده های به زبان دیگر است. از اینرو یکی از مهمترین مسائل زندگی امروز ارائه راه حلی خودکار جهت ترجمه از یک زبان به زبان دیگر است. ترجمه ماشینی یکی از راه هایی است که برای حل این مشکل ارائه ...

15 صفحه اول

بررسی کیفیت ترجمه ماشینی متون انگلیسی به فارسی و میزان موفقیت آن در درک مطلب

هدف از این پژوهش بررسی تاثیر ترجمه ماشینی روی درک مطلب دانشجویان است. برای رسیدن به این هدف، سه نوع متن با سطوح مختلف دشواری انتخاب شد. این متون یک بار توسط مترجم انسانی و یک بار با ترجمه ماشینی (مترجم گوگل) ترجمه شد. در نهایت شش متن بدست آمد. خروجی ترجمه ماشینی مورد ارزیابی قرار گرفته و تجزیه و تحلیل شد. سپس دانشجویان به صورت تصادفی به شش گروه تقسیم شدند و هر گروه یکی از این متون را خوانده و ب...

متن کامل

تحلیل سیستم ترجمه ماشینی آماری فارسی- انگلیسی

این پایان نامه تلاشی است در جهت بررسی رویکرد جدید شاخه ترجمه ماشینی که از روش های آماری برای ساخت یک مترجم خودکار استفاده می کند. در فصل تجربیات ، ابتدا سیستم مترجم ماشینی آماری که برای جفت زبان فارسی-انگلیسی راه اندازی شده بهمراه خروجی این سیستم نشان داده شده است و پارامترهای آن مورد مطالعه قرار گرفته است. در ادامه به عنوان مطالعات جانبی اولین سیستم ترجمه آماری فارسی-آلمانی طراحی شده است. در ا...

15 صفحه اول

مقایسه ساختاری چکیده مقالات پزشکی ترجمه شده از فارسی به انگلیسی با چکیده مقالات اصیل انگلیسی

زمینه و هدف: امروزه مقاله نویسی علمی اهمیت خاصی پیدا کرده است و بهترین راه به اشتراک گذاشتن دستاوردهای علمی بنظر میرسد به شرط آنکه معیارهای تعیین شده مرتبط با زبان مقاله نویسی رعایت گردد. هدف از این تحقیق شناسایی انحرافات ساختاری چکیده های ترجمه انگلیسی چاپ شده در مجلات فارسی زبان ایرانی و مقایسه آنها با چکیده هایی است که از ابتدا به زبان انگلیسی نوشته شده و در مجلات بین المللی پزشکی به چاپ رسی...

متن کامل

مقایسه ساختاری چکیده مقالات پزشکی ترجمه شده از فارسی به انگلیسی با چکیده مقالات اصیل انگلیسی

زمینه و هدف: امروزه مقاله نویسی علمی اهمیت خاصی پیدا کرده است و بهترین راه به اشتراک گذاشتن دستاوردهای علمی بنظر میرسد به شرط آنکه معیارهای تعیین شده مرتبط با زبان مقاله نویسی رعایت گردد. هدف از این تحقیق شناسایی انحرافات ساختاری چکیده های ترجمه انگلیسی چاپ شده در مجلات فارسی زبان ایرانی و مقایسه آنها با چکیده هایی است که از ابتدا به زبان انگلیسی نوشته شده و در مجلات بین المللی پزشکی به چاپ رسی...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه تبریز - دانشکده مهندسی برق و کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023