بهبود عملکرد دسته بندی متون و اسناد فارسی با استفاده از روش pca و ترکیب الگوریتم های جستجوی تکاملی

پایان نامه
  • وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - دانشکده مهندسی برق و کامپیوتر
  • نویسنده هادی رمضانی
  • استاد راهنما احمد فراهی
  • سال انتشار 1392
چکیده

با وجود حجم بالای اطلاعات متنی، نیازمند سیستمی کارا جهت دسته بندی خودکار متون داریم. بنابراین، باید دسته بندی را طوری انجام داد که ضمن افزایش دقت، سبب کاهش زمان و هزینه شود. فرایند دسته بندی متون دارای گام‎های پیش پردازش، وزن دهی، کاهش ویژگی و دسته بندی است که برای هر گام روش‎های مختلفی تا کنون ارائه شده است. یکی از گام‎های تعیین کننده در دسته بندی، کاهش ویژگی‎ها است. این موضوع در زبان فارسی به دلیل وجود ویژگی‎های زیاد و تکراری و دارای معانی نزدیک، فرایندی با پیچیدگی قابل ملاحظه‎ای می‎باشد. با توجه به اهمیت این موضوع، ایده اصلی ما بهبود عملکرد از طریق استخراج بهترین ویژگی‎ها از متون فارسی است که برای این منظور به ارائه روشی با استفاده از تجزیه و تحلیل مولفه‎های اصلی (pca)و روش ترکیبی، از دو الگوریتم مطرح جستجوی تکاملی genetic و pso پرداختیم، بدین ترتیب می‎توان از مزیت جستجوی سراسری در genetic و و قابلیت جستجوی موضعی در pso جهت کاهش ویژگی‎های استخراج شده با هم تجمیع کرد و برای افزایش دقت و کاهش زمان محاسباتی به کار برد. نتایج حاصل از به کارگیری روش پیشنهادی نشان دهنده بهبود عملکرد و کاهش مدت زمان قابل توجهی در تست، بر روی متون فارسی با روش دسته بندی نزدیک‎‎‎ترین همسایه می‎باشد. همچنین در مقایسه با روش‎های مشابه، روش ارائه شده عملکرد بهتری از خود نشان داده است. این موضوع در زبان فارسی به دلیل وجود ویژگی‎های زیاد و تکراری و دارای معانی نزدیک، فرایندی با پیچیدگی قابل ملاحظه‎ای می‎باشد. با توجه به اهمیت این موضوع، ایده اصلی ما بهبود عملکرد از طریق استخراج بهترین ویژگی‎ها از متون فارسی است که برای این منظور به ارائه روشی با استفاده از تجزیه و تحلیل مولفه‎های اصلی (pca)و روش ترکیبی، از دو الگوریتم مطرح جستجوی تکاملی genetic و pso پرداختیم، بدین ترتیب می‎توان از مزیت جستجوی سراسری در genetic و و قابلیت جستجوی موضعی در pso جهت کاهش ویژگی‎های استخراج شده با هم تجمیع کرد و برای افزایش دقت و کاهش زمان محاسباتی به کار برد. نتایج حاصل از به کارگیری روش پیشنهادی نشان دهنده بهبود عملکرد و کاهش مدت زمان قابل توجهی در تست، بر روی متون فارسی با روش دسته بندی نزدیک‎‎‎‎ترین همسایه می‎باشد. همچنین در مقایسه با روش‎های مشابه، روش ارائه شده عملکرد بهتری از خود نشان داده است.

منابع مشابه

ارائه ی یک مدل جهت دسته‌بندی متون فارسی با استفاده از ترکیب روش های دسته بندی

برای دسته­بندی متن از تکنیک­های استخراج اطلاعات، پردازش زبان طبیعی و یادگیری ماشین به طور وسیع استفاده می‌شود به طور کلی هدف یک دسته بند متون، دسته­بندی اسناد در قالب تعداد معینی از دسته­های از پیش تعیین شده می­باشد. هر سند می‌تواند در یک، چند و یا هیچ دسته‌ای قرار بگیرد. در مورد هر سند به این سؤال پاسخ داده خواهد شد که این سند در کدام یک از دسته­ها قرار می‌گیرد. این موضوع می‌تواند در قالب یک ی...

متن کامل

ارائه ی یک مدل جهت دسته‌بندی متون فارسی با استفاده از ترکیب روش های دسته بندی

برای دسته­بندی متن از تکنیک­های استخراج اطلاعات، پردازش زبان طبیعی و یادگیری ماشین به طور وسیع استفاده می شود به طور کلی هدف یک دسته بند متون، دسته­بندی اسناد در قالب تعداد معینی از دسته­های از پیش تعیین شده می­باشد. هر سند می تواند در یک، چند و یا هیچ دسته ای قرار بگیرد. در مورد هر سند به این سؤال پاسخ داده خواهد شد که این سند در کدام یک از دسته­ها قرار می گیرد. این موضوع می تواند در قالب یک ی...

متن کامل

دسته بندی اهداف سوناری با استفاده از روش ترکیبی ازدحام ذرات و جستجوی گرانشی

با توجه به خصوصیات فیزیکی بسیار نزدیک اهداف واقعی و کلاترِ سونار فعال، تفکیک این اهداف، از موضوعات چالش‌برانگیز محققان و صنعت‌گران حوزه آکوستیک می‌باشد. شبکه‌های عصبی چندلایه (MLP) یکی از پرکاربردترین شبکه‌های عصبی در دسته‌بندی اهداف دنیای واقعی هستند. آموزش از مهمترین بخش‌های توسعه این نوع شبکه ها است که در سال‌های اخیر بسیار مورد توجه قرار گرفته است. به منظور آموزش شبکه‌های MLP از دیر باز استف...

متن کامل

The Study of Stressful Factors in Clinical Education for Nursing Students Studying in Nursing and Midwifery College in Khorramabad

کچ هدي پ شي مز هني فده و : شزومآ لاب يني شخب ساسا ي شزومآ مهم و راتسرپ ي تسا . و هنوگ ره دوج لکشم ي شزومآ رد لاب يني ، آراک يي هدزاب و ا ني شزومآ زا شخب راچد ار لکشم م ي دنک . فده اب رضاح شهوژپ سررب ي لماوع سرتسا از ي شزومآ لاب يني رد وجشناد ناي راتسرپ ي هدکشناد راتسرپ ي و يامام ي ماـجنا داـبآ مرـخ تسا هتفرگ . شور و داوم راک : رضاح هعلاطم کي هعلاطم صوت يفي عطقم ي تسا . د...

متن کامل

The effect of cyclosporine on asymmetric antibodies and serum transforming growth factor beta1 in abortion-prone model of mice CBA/J x DBA/2

كچ ي هد فده و هقباس : ي ک ي طقس زورب للع زا اه ي ،ررکم ا لماوع تلاخد ي ژولونوم ي ک ا رد ي ن قم طققس عون ي وراد دقشاب ي س ي روپسولک ي ،ن ح لدم رد طقس شهاک بجوم ي ناو ي CBA/j×DBA/2 م ي تنآ ددرگ ي داب ي اه ي ان و راققتم TGF-β لماوع زا عت مهم يي ن گلماح تشونرس هدننک ي سررب روظنم هب رضاح هعلاطم تسا ي ات ث ي ر اس ي روپسولک ي ن م رب ي از ا ي ن تنآ عون ي داب ي س و اه ي اکوت ي ن TGF...

متن کامل

بهینه‌سازی فرایند ترکیب تصاویر با استفاده از الگوریتم جستجوی گرانشی

از آنجا که به دلیل محدودیت­های عکس­برداری نمی­توان با گرفتن تنها یک عکس از یک صحنه به تصویری با کیفیت و وضوح مطلوب دست یافت، ترکیب تصاویر با استفاده از روش­های گوناگون روز به روز در حال گسترش و بهبود است. از طرفی امروزه از الگوریتم­های جمعیتی مبتنی بر تصادف جهت بهینه­یابی استفاده گسترده­ای می­شود که اغلب با الهام از فرایندهای فیزیکی یا رفتارهای موجودات به­ وجود آمده­اند. الگوریتم بهینه­یابی جست...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - دانشکده مهندسی برق و کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023