محمدصادق دشتی

نام پژوهشگر: محمدصادق دشتی

ارائه مدلی جهت تصحیح غلطهای املایی بر پایه اطلاعات معنایی

پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده مهندسی کامپیوتر 1393
محمدصادق دشتی مصطفی فخراحمد

امروزه شاهد توجهی روزافزون به مقوله پردازش زبان طبیعی و زمینه های مرتبط به آن، به خصوص پردازش زبان طبیعی آماری هستیم. با توجه به ماهیت و اهمیت این حوزه مدل های متعددی در جهت پاسخگویی به نیازهای کاربران ارایه شده است. تصحیح غلطها یکی از وظایف اصلی و اولیه در حوزه ی پردازش زبان طبیعی آماری میباشد. روش ارایه شده در این پایان نامه به امر تشخیص و تصحیح خودکار خطاهای معنایی و املایی موجود در متون انگلیسی میپردازد. مدل حاضر، روش جدیدی را جهت تشخیص غلطهای معنایی معرفی مینماید. این مدل با استفاده از پایگاه دانش wordnet، مجموعه زوجهای از پیش تعریف شده و استفاده از اطلاعات هم شکل شناسی، اقدام به بازیابی اطلاعات معنایی با شیوه ای جدید مینماید. پس از آن یک مدل زبانی تغییر یافته ی انحصاری که بر پایه ی مدلهای پیشین توسعه یافته است، جهت برآورد اطلاعات احتمالی معرفی می گردد. در نهایت با استفاده از مدل زبانی ابداعی اقدام به محاسبه احتمالات جهت انتخاب مناسبترین کلمه، جهت جایگزینی با کلمه ی اشتباه مینماید. نتایج آزمایش نشان دهنده ی دقت قابل توجه مدل حاضر در مقایسه با مدل های مشابه می باشد.

۱۵ صفحه ی اول