سیستم خودکار خلاصه ساز متون فارسی

پایان نامه
  • وزارت علوم، تحقیقات و فناوری - دانشگاه الزهراء - دانشکده فنی
  • نویسنده فاطمه غزالی
  • استاد راهنما نوشین ریاحی
  • سال انتشار 1392
چکیده

دراین پژوهش روشی ترکیبی از الگوریتم ژنتیک و شبکه عصبی rbf برای خلاصه سازی استخراجیِ متون فارسی پیشنهاد شده است، که ابتدا به امتیازدهی پاراگراف ها پرداخته می شود، سپس پاراگراف های برتر را انتخاب کرده و به محاسبه امتیاز جملات آن ها می پردازد. همچنین جهت تعیین میزان اهمیت هر یک از ویژگی های جملات از یک شبکه عصبی mlp بهره گرفته شده است. سپس با استفاده از یک شبکه عصبی rbf به گزینش جملات برتر به عنوان جمعیت اولیه الگوریتم ژنتیک پرداخته می شود و تولید خلاصه نهایی صورت می گیرد. الگوریتم ژنتیک با اهمیت دادن به میزان پیوستگی و خوانایی خلاصه تولید شده، جملات را گزینش می نماید. در نتیجه می توان با ترکیب آن ها میزان کارایی را در حد قابل قبولی افزایش داد. جهت ارزیابی روش پیشنهادی ارائه شده، علاوه بر استفاده از معیار های ارزیابی درونی، از روش ذهنیِ ارزیابیِ دستی نیز بهره گرفته شده است. از جمله معیار های پر اهمیت ارزیابی درونی، معیار دقت و بازخوانی می باشد، که از ترکیب این دو نیز معیار f-score حاصل می گردد. که نتیجه f-score نهایی به طور میانگین 52/0 بوده است. همچنین نتایج قضاوت انسانی افراد خبره نیز به صورت 60% خوب، 30% متوسط و 10% ضعیف، حاصل شده است. لازم به ذکر است که داده های مورد استفاده جهت آموزش و ارزیابی این سیستم خلاصه ساز، پیکره اخبار همشهری ارائه شده توسط آزمایشگاه پردازش زبان طبیعی دانشگاه تهران و همچنین اخبار ورزشی خبرگزاری ایسنا و دانشنامه فارسی ویکی پدیا می باشد.

منابع مشابه

ارائه سیستم خلاصه ساز متون فارسی برمبنای ویژگی های زبان شناختی و رگرسیون

Considering the vast amount of existing written information and the shortage of time, optimal summarization of books, articles, news reports, etc. on the Web is a major concern of researchers. In this paper, we propose a new approach for Persian single-document Summarization based on several linguistic features of text. In our approach after extracting the linguistic features for each sentence,...

متن کامل

ارائه یک سیستم هوشمند و معناگرا برای ارزیابی سیستم های خلاصه ساز متون

Nowadays summarizers and machine translators have attracted much attention to themselves, and many activities on making such tools have been done around the world. For Farsi like the other languages there have been efforts in this field. So evaluating such tools has a great importance. Human evaluations of machine summarization are extensive but expensive. Human evaluations can take months to f...

متن کامل

ارائه یک روش خلاصه ساز خودکار متون فارسی به روش معنایی

خلاصه سازی خودکار متن یکی از جنبه های مهم در بازیابی اطلاعات می باشد. در این پایان نامه یک روش جدید برای خلاصهسازی خودکار متون فارسی پیشنهاد شده است که رویکردی مبتنی بر معنا دارد. روش پیشنهادی، دارای سه فاز پیش پردازش، پردازش و تولید خلاصه نهایی می باشد. در مرحله پیش پردازش، ریشه کلمات با استفاده از یک روش مبتنی بر فرهنگ واژگان بدست می آید. مجموعه ترادف جملات موجود در متن از طریق همین فرهنگ واژ...

15 صفحه اول

بهبود خلاصه سازی خودکار متون فارسی با استفاده از روش‌های پردازش زبان طبیعی و گراف شباهت

A significant amount of available information is stored in textual databases which contains a large collection of documents from different sources (such as news, articles, books, emails and web pages). The increasing visibility and importance of this class of information motivates us to work on having better automatic evaluation tools for textual resources. The automatic summarization of tex...

متن کامل

خلاصه سازی خودکار متون فارسی مبتنی بر هستی شناسی

با توجه به گسترش روزافزون اطلاعات در دسترس از طریق اینترنت، لزوم استفاده از روش های خلاصه سازی خودکار متن، بیش از پیش احساس می شود. روش هایی که با استخراج مهمترین مطالب موجود در اسناد مانع از مطالعه کامل حجم انبوه از آنها شوند. خلاصه سازی عبارت است از فشرده سازی متن (متون) منبع و تولید یک نسخه کوتاه تر از آن به نحوی که محتوای اطلاعاتی آن حفظ شود. اغلب سیستم های خلاصه ساز با استفاده از روش های س...

15 صفحه اول

ارائه یک سیستم هوشمند و معناگرا برای ارزیابی سیستم های خلاصه ساز متون

امروزه با افزایش منابع متنی در شبکه جهانی وب، هر روز بر گستره‏ ی اطلاعات قابل دسترس برای کاربران افزوده می شود بنابراین جهت نگهداری و بازیابی و پردازش آنها از سامانه ‏های خلاصه‏ سازی خودکار متن، استفاده می‏ کنیم. میزان کیفیت خلاصه‏ سازهای ماشینی، توسط انسان‏ها مورد بررسی قرار می‏ گیرد اما این کار نیروی متخصص و زمان زیادی را می‏ طلبد و هزینه بر خواهد بود. بنابراین برای حل این مشکل، در این مقاله ...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه الزهراء - دانشکده فنی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023