نام پژوهشگر: الهه خدادادیان

رتبه بندی اسناد وب بر اساس یادگیری تقویتی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - پژوهشکده برق و کامپیوتر 1391
  الهه خدادادیان   محمد قاسم زاده

چالش اصلی در غالب موتورهای جستجو، رتبه بندی اسناد بازیابی شده برای ارائه بهترین پاسخ به پرس و جوی کاربران است. در این پایان نامه با فرموله کردن این مسئله با استفاده از مفاهیم یادگیری تقویتی، دو الگوریتم جدید رتبه بندی مبتنی بر اتصال با عناوین rl_rank و rurl ارائه شده است. یادگیری تقویتی یک تکنیک قویِ هوش مصنوعی است که حول جایزه گذر بین حالت ها و تابع ارزش، عمل می کند. در الگوریتم rl_rank، هر صفحه ی وب به عنوان یک حالت لحاظ شده که کاربر همانند یک موج سوار تصادفی بین آن ها حرکت می کند. حرکت بین صفحات با کلیک کردن بر روی یکی از پیوندهای خروجی صفحه جاری با احتمال مساوی می باشد. در این الگوریتم، به ازای گذر از هر حالت (صفحه) به حالت دیگر جایزه ای در نظر گرفته می شود و با استفاده از تعریف تابعِ ارزش هر صفحه به عنوان ارزش آن، صفحات رتبه بندی می شوند. در ضمن یک روش ترکیبی از ترکیب وزن دار rl_rank و bm25 نیز ارائه شده است. الگوریتم rurl طبق تعاریف rl_rank می باشد، با این تفاوت که این روش بر خلاف الگوریتم rl_rank وابسته به پرس وجو است. در این روش ابتدا زیر گرافی با توجه به پرس وجوی وارد شده، تشکیل می شود و سپس ایده گفته شده بر روی آن اعمال می شود. الگوریتم های ارائه شده بر روی مجموعه محک های معروف dotir و trec-2003 ارزیابی شدند و سپس نتایج بدست آمده بر اساس معیارهای مربوطه آنالیز شدند. نتایج آزمایش ها نشان دادند که الگوریتم های ارائه شده به ترتیب عملکرد بسیار بهتری نسبت به الگوریتم های معروف pagerank و hits بر روی هر دو مجموعه محک دارند. همچنین نتایج حکایت از پیشرفت قابل توجهی در الگوریتم های رتبه بندی با استفاده از مفاهیم یادگیری تقویتی دارد.