نام پژوهشگر: جاوید ابراهیمی

خلاصه سازی اخبار با یک روش ترکیبی خوشه بندی - ژنتیکی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس - دانشکده برق و کامپیوتر 1391
  جاوید ابراهیمی   محمد صنیعی آباده

با گسترش روز افزودن داده های متنی ، بدست آوردن اطلاعات مورد نظر مسئله اساسی در عصر اینترنت است. برای تطبیق با این مسئله فناوریهای جدید که قادر به پردازش داده های حجیم بصورت موثر هستند مورد نیاز است. خلاصه سازهای خودکار یکی از ابزارهای مهم در این راستاست که در حوزه های گوناگون مثل اسناد پزشکی ، مقالات علمی و آرشیو اخبار مورد استفاده قرار می گیرد. این پایان نامه به خلاصه سازی چند سندی در زبان انگلیسی می پردازد که در آن مجموعه ای از اخبار بهم مرتبط به عنوان ورودی دریافت می شود و تعدادی جمله به صورت فشرده به عنوان خروجی تحویل داده می شود.. در حالیکه اغلب رویکردهای موجود ، جملات را انتخاب کرده و سپس افزونگی را بصورت حریصانه حذف می کنند، اخیرا رویکردهای مبتنی بر بهینه سازی در تعیین کیفیت خلاصه بصورت کلی و بهره گیری از ویژگیهای جمعی جملات موثر واقع شده اند. در برخی از این روشها ، خلاصه سازی به یک مسئله بهینه سازی p-median تبدیل می شود. ما نشان میدهیم که این تقریب نادقیق است و برای رفع مشکل آن یک تابع بهینه سازی فازی جدید معرفی می کنیم که از اطلاعات موجود در خوشه های جملات مرتبط یا همان موضوعات ، استفاده می کند. برای این مقصود یک الگوریتم خوشه بندی مبتنی بر گراف معرفی می شود که خروجی آن یک ماتریس عضویت فازی است که میزان تعلق هر جمله به موضوعات درمتن را مشخص می نماید. برای بهینه سازی تابع هدف از یک الگوریتم ژنتیکی استفاده شده است که به کمک عملگرهای هوشمند بهبود یافته است و برای ارزیابی کار از مجموعه داده های duc2001 و duc2004 استفاده شده است. رویکرد ما در معیار rouge-1 بر روی این داده ها به ترتیب به دقت 0.36389 و 0.39826 می رسد.