نام پژوهشگر: محمدامین گلشنی

خزش و رتبه بندی کارا مبتنی بر ویژگی های گراف وب
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه یزد 1390
  محمدامین گلشنی   علی محمد زارع بیدکی

موضوع پایان نامه به خزش و رتبه بندی صفحات وب اختصاص داده شده است. خزش و رتبه بندی از بخش های مهم در موتور های جستجو می باشند که به ترتیب وظیفه ی بارگذاری صفحات با کیفیت و رتبه بندی نتایج بازگشتی به کاربر را بر عهده دارند. تا کنون الگوریتم های خزش متنوعی پیشنهاد شده اند، اما یا بازدهی مناسبی نداشته اند یا از پیچیدگی بالایی برخوردار هستند. لذا الگوریتم خزش کارایی به نام ieca(intelligent effective crawling algorithm) پیشنهاد می گردد که نسبت به الگوریتم های فعلی از کارایی بالاتر و پیچیدگی پایین تری برخوردار می باشد. در روش پیشنهادی اهمیت صفحات بر اساس چندین ویژگی نظیر درجات ورودی ، فاصله لگاریتمی و خاصیت ساختاری گراف وب (بالابودن درجه ورودی در صفحات با کیفیت) تعیین می گردد. نتایج آزمایشات بر روی چهار گراف مختلف وب (ایران، انگلستان، ایتالیا و گراف وب دانشگاه برکلی) حاکی از کاراتر بودن الگوریتم پیشنهادی نسبت به سایر الگوریتم های خزش می باشد. همچنین بخشی از پایان نامه به مبحث رتبه بندی اختصاص گرفته و مدلی مبتنی بر انتشار شامل دو الگوریتم به نام های hyperlink-based slash-score propagation(hss) و hyperlink-based slash-term propagation(hst) جهت تعیین رتبه ی صفحات پیشنهاد گردید. جهت ارزیابی مدل رتبه بندی پیشنهادی letor 3 مورد استفاده قرار گرفت. بر اساس آزمایشات دو الگوریتم پیشنهادی نسبت به سایر الگوریتم های رتبه بندی انتشاری از دقت بهتری برخوردار هستند.