رتبه بندی هوشمند اسناد وب با استفاده از روش های جفتی

پایان نامه
چکیده

امروزه به دلیل حجم عظیم اطلاعات در وب و همچنین پویا بودن اطلاعات، مهم ترین چالش در بازیابی اطلاعات وب، خصوصاً موتورهای جستجو، رتبه بندی نتایج در پاسخ به پرس و جوی کاربر است. تاکنون الگوریتم های متنوعی که مبتنی بر محتوا و اتصال می باشند ارائه شده اند. علاوه بر روش های سنتی، روش های نوینی با عنوان روش های یادگیری جهت رتبه بندی مطرح شده است که به طور خلاصه عبارت است از ایجاد یک مدل خودکار رتبه بندی بر اساس داده های آموزشی به نحوی که این مدل قادر به مرتب سازی اسناد جدید بر اساس درجه مرتبط بودن آن ها با پرس وجوهای کاربران، میزان اهمیت اطلاعات اسناد و فاکتورهای دیگری از این قبیل باشد. در این پایان نامه ابتدا به معرفی رویکردهای اصلی روش های یادگیری جهت رتبه بندی پرداخته و در ادامه به بررسی تعدادی از الگوریتم های رتبه بندی به روش یادگیری مبتنی بر رویکرد جفتی می پردازیم. در نهایت روشی جدید جهت رتبه بندی صفحات وب مبتنی بر روش یادگیری جفتی ارائه می گردد. این روش، ترکیبی از روش های رتبه بندی svm و rankboost می باشد و برای رتبه بندی از روش svmprimal به عنوان یادگیرنده ضعیف در الگوریتم رتبه بندی rankboost استفاده می کند. این روش بر روی مجموعه داده trec2004 پیاده سازی شده است و نتایج ارزیابی های صورت گرفته، بهبود 10% نسبت به الگوریتم rankboost و بهبود 38% نسبت به الگوریتم svmprimal بر اساس معیار دقت را نشان می دهد.

منابع مشابه

بهره گیری از بازخورد کاربر در روش های هوشمند تعاملی رتبه بندی اسناد وب

امروزه رتبه بندی مبتنی بر یادگیری به مبحث تحقیقاتی مهمی در زمینه ی بازیابی اطلاعات تبدیل شده است. در حقیقت یک داستان یکسان برای روش های رتبه بندی اتفاق می افتد. در این داستان، هدف فراهم کردن مدل رتبه بندی بر طبق ارتباط بین اسناد و پرس وجو است که اسناد را به عنوان ورودی دریافت کند و لیست اسناد را بر حسب میزان مرتبط بودنشان به پرس وجوی کاربر مرتب کند. در این پایان نامه، سه الگوریتم رتبه بندی مبتن...

15 صفحه اول

رتبه بندی وب‌سایت‌های دانشکده های داروسازی ایران با استفاده از ضریب تاثیرگذار وب

       Introduction: Considering the importance of websites in informing users and establishing communications, universities have started to design their own websites for organizing and making their information accessible. Evaluation of these websites through webometric methods will help recognize pitfall and strong points to reach a better quality and constant improvement. This study was aimed...

متن کامل

رتبه بندی اسناد وب بر اساس روش های انتشار وابستگی

در سالیان اخیر استفاده از وب به عنوان منبع اصلی کسب اطلاعات، رشد فزاینده ای داشته است. از جمله ابزارهای بسیار کارآمد برای جستجو در وب، موتورهای جستجو هستند و چالش اصلی موتورهای جستجو، رتبه بندی نتایج بازیابی شده در پاسخ به پرس وجوی کاربر است. تاکنون الگوریتم های مختلفی بدین منظور ارائه شده اند که به دو دسته کلی الگوریتم های مبتنی بر محتوا مانند tf-idf و bm25 و مبتنی بر اتصال مانند pagerank، dis...

15 صفحه اول

رتبه بندی وب سایت های دانشکده های داروسازی ایران با استفاده از ضریب تاثیرگذار وب

مقدمه: با توجه به اهمیت و جایگاه وب سایت ها در امر اطلاع رسانی و ارتباط با مخاطبین، دانشگاه ها برای سازماندهی و دسترس پذیرکردن اطلاعات و معرفی قابلیت ها و توانمندی های خود، اقدام به طراحی وب سایت و ارائه اطلاعات از آن طریق می نمایند. به منظور دستیابی به کیفیت بهتر و بهبود دائمی این وب سایت ها، ارزیابی آن ها از طریق روش های وب سنجی باعث شناسایی نقاط ضعف و قوت و پیشرفت هرچه بیشتر آن ها خواهد شد. ...

متن کامل

ارزیابی و رتبه بندی وب سایت‌ هتل‌های پنج ستاره شهر مشهد با استفاده از روش شباهت به حل ایده‌آل فازی

ارائه اطلاعات جامع و کامل از خدمات در فضای مجازی، نقش زیادی در انتخاب هتل ها به عنوان مهم‌ترین مقاصد اقامتی گردشگران خواهد داشت. بنابراین لازم است به لحاظ مدیریتی وب سایت هتل‌ها مطابق با نیاز کاربران طراحی و تهیه گردند. هدف مطالعه ، ارزیابی و رتبه‌بندی وب سایت هتل های پنج ستاره مشهد می‌باشد. به این منظور، ابتدا با مرور پیشینه ، 51 شاخص‌ جهت ارزیابی وب سایت هتل در دو بعد عملکرد کارکردی (25 شاخص)...

متن کامل

شناسایی و رتبه بندی عوامل تخریب جنگل های مانگرو با استفاده از روش Promethee II

جنگل‌های مانگرو در ایران اهمیت خاصی دارند. این تحقیق باهدف شناسایی و رتبه‌بندی عوامل تخریب جنگل‌های مانگرو انجام‌شده است. نتایج این تحقیق می‌تواند مبنای استواری برای درک شرایط پیش روی جنگل‌های مانگرو باشد و باعث بهبود مدیریت و حفاظت جنگل‌های مانگرو شود. در این پژوهش به‌منظور شناسایی و رتبه‌بندی عوامل تخریب از روش تصمیم‌گیری چند معیاره Promethee II استفاده شد. رتبه‌بندی عوامل طبیعی تخریب جنگل‌ها...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده برق و کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023