نام پژوهشگر: سمیه باقربیگی

ساخت نیمه خودکار وردنت افعال فارسی از وردنت دیگر مقوله های نحوی زبان فارسی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه علامه طباطبایی - دانشکده ادبیات و زبانهای خارجی 1389
  سمیه باقربیگی   مهرنوش شمس فرد

هم اکنون از وردنت به عنوان ابزاری قدرتمند در زمینه پردازش زبان طبیعی استفاده می شود. در این پژوهش درجهت فراهم آوردن منبعی برای پردازش های رایانه ای بر روی زبان فارسی، به دنبال ارائه ی الگویی برای ساخت نیمه خودکار وردنت افعال فارسی بوده ایم که هم بتوانیم به ساخت وردنت افعال نائل شویم و هم به الگوی ساخت فعل مرکب و رابطه ی میان اجزاء آن دست یابیم. به این ترتیب این پژوهش را می توان به حوزه ی معناشناسی واژگانی و زبانشناسی رایانه ای و زبان شناسی پیکره ای مرتبط دانست. فرضیه ی اصلی ساخت این سیستم استفاده از وردنت دیگر مقوله های نحوی زبان فارسی(در اینجا اسم و صفت) می باشد که در طی سه فاز 1. ساخت فعل مرکب 2. ساخت مجموعه ی هم معنا 3. استخراج روابط به آزمون آن پرداختیم. روش به کار گرفته شده در این سیستم در میان روش های ساخت نیمه خودکار وردنت افعال روشی نو محسوب می شود که بر مبنای ویژگی ساخت افعال مرکب بنا نهاده شده است. در فاز اول با بکارگیری الگوی خاص ساخت واژی فعل مرکب فارسی ترکیبات ممکن فعل مرکب را ساخته، سپس با جستجو در فرهنگ و دو پیکره، افعال مرکب فارسی را استخراج کردیم. سپس در فاز دوم ابتدا در مرحله ی اول با قرار دادن برچسب معنایی بر روی افعال مرکب، افعال مرکب ترکیبی را از اصطلاحی جدا کردیم تا بتوانیم بر مبنای معنای اجزاء فعل مرکب ترکیبی مجموعه های هم معنای آنها را بسازیم. برای دستیابی به این هدف هر فعل مرکب با توجه به معنای جزء غیر فعلی آن به مجموعه ی هم معنای اسمی یا صفتی استخراج شده از آن متصل شد، سپس در مرحله ی دوم با در نظر گرفتن 75 دسته ی هم معنای جزء فعلی، افعال مرکب هم معنا را به صورت خودکار در یک مجموعه ی هم معنا گرد آوردیم. یافته ها نشان داد که معنای فعل مرکب از معنای هر دو جزء آن به دست می آید و اجزاء غیر فعلی در افعال مرکب ترکیبی چند معنا هستند به طوریکه گستردگی معنایی آنها به گونه ای است که در برخی جاها با هم همپوشی دارند به عبارتی هر معنی یک جزء فعلی می تواند با معنی یک یا چند جزء فعلی دیگر معادل باشد. سپس در فاز سوم با درنظر گرفتن تناوب های تقابل و سببی اجزاء فعلی، روابط سببی و تقابل میان مجموعه های هم معنا استخراج شد. نتایج نشان داد که رابطه ی تقابل میان برخی از مفاهیم فعلی فقط از رابطه ی تقابل میان اجزاء غیر فعلی آنها یعنی رابطه ی تقابل میان مفاهیم اسمی یا صفتی، میان برخی دیگر از رابطه ی تقابل میان اجزاء فعلی آنها و میان برخی، از هر دو جزء غیرفعلی و فعلی قابل استخراج است. از طرفی، رابطه ی سببی میان مفاهیم فعلی از رابطه ی سببی میان اجزاء فعلی قابل استخراج می باشد. در نهایت با در نظر گرفتن یک طبقه بندی از اجزاء فعلی فعل مرکب و رابطه ی شمول معنایی میان اجزاء غیر فعلی، رابطه ی شمول معنایی میان مجموعه های هم معنا استخراج شد.