تخمین اطمینان خروجی ترجمه ماشینی

پایان نامه
چکیده

به دلیل ابهام ذاتی موجود در زبان طبیعی، تقریبا همه فناوری های پردازش زبان طبیعی ناکاملند. با این حال با تخمینی از کیفیت خروجی، کاربران می توانند به طور مناسبی با ناکامل بودن آنها برخورد کنند. زمینه تحقیقاتی که به این مسئله می پردازد تخمین اطمینان نامیده می شود. هدف اصلی تخمین اطمینان کاربردی تر کردن فناوری های ناکامل است. در حوزه ترجمه ماشینی نیز با وجود پیشرفت های به دست آمده در سال های اخیر، این فناوری هنوز قادر به ترجمه دقیق متون نیست به طوری که گاهی ممکن است ترجمه متنی توسط ماشین و ویرایش خروجی توسط انسان، زمان بیشتری نسبت به ترجمه مستقیم توسط انسان بگیرد. در چنین حالتی، داشتن تخمینی از درستی خروجی ترجمه ماشینی برای ویرایشگران مفید است تا تلاش خود را به جملات نادرستی معطوف کنند که نیاز به تغییرات پرهزینه ندارند. علاوه بر پس ویرایش، تخمین اطمینان خروجی ترجمه ماشینی برای کاربردهایی که هدف آنها ارتقا کیفیت ترجمه ماشینی است، از قبیل ترکیب چند سامانه ترجمه گر، بازتولید خروجی و مرتب سازی دوباره لیست چند ترجمه برتر، مفید می باشد. تخمین اطمینان یا سنجش کیفیت خروجی ترجمه ماشینی یکی از موضوعات چالشی در زمینه ترجمه ماشینی محسوب می شود. همچنین برای جفت زبان انگلیسی-فارسی پژوهش های چندانی در زمینه تخمین اطمینان صورت نگرفته است. در این پژوهش مجموعه ای از ویژگی های مبتنی بر ساختار و مبتنی بر محتوای مستقل از سامانه ترجمه گر ارائه شده و کارایی چند روش یادگیری برای ترکیب این ویژگی ها بررسی شده است. مزیت ویژگی های ساختاری ارائه شده این است که برخلاف اکثر ویژگی های ارائه شده در گذشته، برای بررسی صحت ساختاری کلمه مقصد از جمله مبدا استفاده می کنند. همچنین برای نخستین بار از بردار زمینه برای تخمین اطمینان استفاده شده است و چالش متفاوت بودن فضای بردارهای مبدا و مقصد، با استفاده از روشی آماری حل شده است. نتایج به دست آمده از آزمون ویژگی های پیشنهادی در قالب جداولی ارائه گردیده است. کلمات کلیدی: تخمین اطمینان، ترجمه ماشینی، بردار زمینه، اطلاعات متقابل، ویژگی های مبتنی بر ساختار، ویژگی های مبتنی بر محتوا.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

تخمین اطمینان خروجی ترجمه ماشینی با استفاده از ویژگی های جدید ساختاری و محتوایی

Despite machine translation (MT) wide suc-cess over last years, this technology is still not able to exactly translate text so that except for some language pairs in certain domains, post editing its output may take longer time than human translation. Nevertheless by having an estimation of the output quality, users can manage imperfection of this tech-nology. It means we need to estimate the c...

متن کامل

تخمین اطمینان خروجی ترجمه ماشینی با استفاده از ویژگی های جدید ساختاری و محتوایی

با وجود پیشرفت های اخیر در حوزه ترجمه ماشینی، این تکنولوژی قادر به ترجمه دقیق متون نیست و گاهی ممکن است ویرایش خروجی آن زمان بیشتری نسبت به ترجمه دستی بگیرد. با این حال با داشتن تخمینی از کیفیت خروجی، کاربران می توانند به طور مناسبی با ناکامل بودن این تکنولوژی برخورد کنند. برای کاربردهایی که هدف آنها بالا بردن کیفیت ترجمه ماشینی است، نظیر ترکیب خروجی سامانه های ترجمه گر مختلف، بازترتیب لیست چند...

متن کامل

نگرشی بر ترجمه ماشینی

از دیر باز بشر همیشه در آرزوی اختراع دستگاهی بوده است که بتواند متون را از زبان مبداء به زبان مقصد با سرعت و دقت فراوان ترجمه کند. تلاش برای رسیدن به این آرزو بیش از پنج دهه است که آغاز شده است و محققان دسا اوردهایی در زمینه طراحی سیستم ها و ساخت ماشین های مترجم بدست آورده اند ولی نام ماشینهای مترجم همواره مفهوم منفی را در ذهن افراد تداعی می کند و بیشتر مترجمان و محققان نظر منفی درباره ماشینهای...

متن کامل

گروه اعداد در ترجمه ماشینی

هدف از عرضه گروه اعداد، ساختن ترکیبات مجاز از اعداد اصلی و ترتیبی در زبان فارسی است. در این مقاله سی و هشت عضو دستگاه عددگویی فارسی در چهارگروه چندعضوی و دو گروه تک عضوی قرار داده شده اند. سی و هشت عضو مذکور در دو دسته قاعده کلی (یعنی قواعد گروه اعداد اصلی و اعداد ترتیبی) جای داده شده اند. تعداد قواعد اعداد اصلی شامل چهل و هفت، و تعداد قواعد اعداد ترتیبی (که خود بر دو نوع اند) شامل چهار قاعده ا...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه الزهراء - دانشکده فنی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023