نام پژوهشگر: سعیده غلامرضازاده مطلق

یک الگوریتم مبتنی بر گراف برای خلاصه سازی متون
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - پژوهشکده اقلیم شناسی 1393
  سعیده غلامرضازاده مطلق   مهرداد جلالی

سیستم های خلاصه برداری از متن، یافتن اطلاعات مورد نیاز را از میان خیل عظیم اطلاعاتی که در قالب متن هستند، تسریع می کنند. این سیستم ها از روش های مختلفی برای انتخاب مهم ترین موضوعات متن استفاده می کنند. یکی از روش هایی که در این زمینه به صورت گسترده مورد استفاده قرار می گیرد، استفاده از ساختار گراف و ویژگی های آن برای انتخاب مهم ترین جملات متن است. الگوریتم ارائه شده در این تحقیق، سعی در خلاصه سازی متون فارسی با استفاده از ساختار گراف و ساختن مسیر بر اساس آن دارد. الگوریتم پیشنهادی، متن ورودی را به صورت گراف نمایش داده و با استفاده از ویژگی های ساختار گراف، روش های آماری، ویژگی های ساختاری متن و استفاده از مسیرها، مهم ترین و پر محتواترین جملات متن را انتخاب می کند. نوآوری این الگوریتم در مقایسه با کارهای پیشین، استفاده از مسیرها و بررسی میزان اهمیت ارتباط موجود بین جملات، به منظور حفظ هر چه بیشتر انسجام و جریان موضوعی متن است. برای ارزیابی کیفیت خلاصه تولیدی، میزان شباهت آن با خلاصه انسانی مورد بررسی قرار گرفته است. نتایج بررسی ها نشان می دهد که الگوریتم ارائه شده در مقایسه با کارهای پیشین مطرح شده در زمینه خلاصه سازی متون فارسی، خلاصه ای با شباهت بیشتر به خلاصه انسانی تولید می کند.