محمد هادی صدرالدینی

نام پژوهشگر: محمد هادی صدرالدینی

ارائه روشی کارا جهت تطابق الگوی تقریبی در ترجمه ماشینی مبتنی بر مثال

پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده مهندسی برق و کامپیوتر 1392
میثم روستایی محمد هادی صدرالدینی

ترجمه ماشینی یکی از کاربردی ترین شاخه ها در زمینه پردازش زبان طبیعی است. ترجمه ماشینی فرآیند تجزیه و تحلیل خودکار متن در زبان مبدأ و تولید متن معادل آن در زبان هدف است. یکی از سیستم های ترجمه ماشینی سیستم مبتنی بر مثال است که ویژگی اصلی آن استفاده از پیکره متنی دو زبانه به عنوان پایگاه دانش می باشد تا بجای ترجمه لفظ به لفظ و بعضاً اشتباه و نامتعارف، یک ترجمه مشابه ترجمه انسانی بدست آید. فرآیند تطابق یکی از مهمترین بخش ها در سیستم های ترجمه ماشینی مبتنی بر مثال است. این فرآیند برای یافتن نزدیک ترین جمله موجود در پیکره متنی جهت ترجمه جمله ورودی می باشد. در این پژوهش، رویکرد جدیدی بر مبنای تطابق تقریبی جملات ارائه شده است که از شباهت معنایی برای یافتن نزدیکترین جمله استفاده می کند. مهمترین مزیت این روش قابلیت استخراج جملاتی است که اگرچه از لحاظ لغوی متفاوتند اما معنای بسیار نزدیکی به هم دارند. در این تحقیق ابتدا معیار شباهتی بر مبنای الگوریتم های یادگیری ماشین و تکنیک های پردازش زبان طبیعی برای تعیین شباهت معنایی جملات ارائه شده است. سپس با توجه به کارایی این رویکرد در تعیین شباهت معنایی از آن در تطابق تقریبی استفاده شده است. در راهکار پیشنهادی برای تطابق تقریبی جملات ابتدا با استفاده از رویکرد بازیابی اطلاعات جملات کاندید به عنوان جملات نزدیک به جمله ورودی مشخص شده و سپس با استخراج ویژگی های زبان شناسی، شباهت میان جمله ورودی و جملات کاندید به منظور تعیین نزدیکترین جمله محاسبه می گردد. هم چنین به منظور افزایش دقت محاسبه شباهت و کاهش خطا، وزن بهینه هر یک از ویژگی ها با استفاده از الگوریتم رگرسیون خطی تعیین شده است. نتایج آزمایش نشان می دهد رویکرد پیشنهادی به شکل قابل توجهی عملکرد فرآیند تطابق را بهبود می بخشد.

ارائه روش های جدید تکرار داده در گرید داده با رویکرد سازگاری بین داده ها

پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز 1388
عباس حری نجف آبادی غلامحسین دستغیبی فرد

گرید داده سرویس هایی را برای به اشتراک گذاری و مدیریت فایل ها ی بسیار بزرگ را در سرتاسر دنیا فراهم می کند. مسئله اساسی در گرید داده کاهش ترافیک شبکه است. روش اساسی برای کاهش ترافیک شبکه ایجاد نسخه از فایل ها در سایت های مختلف است. وقتی چندین نسخه از فایل در سایت های مختلف وجود داشته باشد، انتخاب بهترین نسخه از بین آنها می تواند باعث کاهش زمان اجرای کارها شود. اما وقتی که از یک فایل نسخه های متعددی وجود داشته باشد و این نسخه ها به طور جداگانه به روز شوند مسئله سازگاری بین نسخه ها به وجود می آید. در این پایان نامه دو روش جدید برای تکرار فایل ها و زمانبندی کارها در گرید داده ارائه گردیده است. در روش اول الگوریتم تکرار و زمانبندی بر اساس ساختار سلسله مراتبی سه گانه ارائه گردیده. یک روش الگوریتم تکرار و زمانبندی نیز بر اساس پیش بینی زمان انتقال فایل پیشنهاد گردیده است. نتایج شبیه سازی توسط شبیه ساز optorsim بهبود کارایی هر دو روش نسبت به روش های قبلی را نشان می دهد