نام پژوهشگر: حمزه هدهدکیان

انتخاب بهینه ی کلمات کلیدی برای موتور های جستجو
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود 1390
  حمزه هدهدکیان   مرتضی زاهدی

به طور کلی، روش های ارائه شده جهت استخراج خودکار کلمات کلیدی، سعی در بدست آوردن نتایج بهتر در معیارهایی مانند بازخوانی و دقت دارند. اگرچه این معیارها، میزان کارایی روش استخراج کلمات کلیدی در نقش یک انسان را نشان می دهد اما با توجه به نقش غیرقابل انکار موتورهای جستجو در دنیای امروز، به نظر می رسد که در انتخاب کلمات کلیدی علاوه بر توجه به معیارهای رایج بازیابی اطلاعات باید به افزایش میزان دسترسی پذیری متن توسط موتورهای جستجو نیز توجه ویژه ای شود. در این تحقیق روشی جدید برای استخراج خودکار کلمات کلیدی ارائه شده است که همزمان با افزایش دسترسی پذیری متن، امتیاز مناسبی در معیارهای بازخوانی و دقت نیز کسب می کند. روش ارائه برای استخراج کلمات کلیدی از دو تابع امتیاز دهی استفاده می کند: تابع امتیاز دهی به کلمات کلیدی و تابع ارزیابی میزان دسترسی پذیری. تابع اول سعی در بالا بردن بازخوانی و دقت دارد در حالیکه تابع دوم در طول فرایند آموزش با استفاده از الگوریتم ژنتیک و بازخوردهای موتورهای جستجو به بهینه سازی ضرایب خصوصیات درتابع اول می پردازد. همچنین در این پروژه با بهره گیری از کلمات برجسته ساز، فرایند پس پردازشی ارائه شده که با گزینش نهایی کلمات کلیدی از میان لیست کلمات کاندید، منجر به بهبود کارایی روش در معیار دقت می شود. آزمایشات نشان می دهد که با به کارگیری تعداد تکرار مناسب در طی فرایند آموزش و ایجاد موازنه منطقی در کسب هریک از سه معیار یاد شده می توان به نتایج مطلوبی در هر سه معیار دست یافت.