نام پژوهشگر: سیامک ساعدی

گسترش پرس و جو در موتور جستجوی فارسی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه یزد 1390
  سیامک ساعدی   علی محمد زارع بیدکی

پرس وجو برای بیان نیازهای کاربران به اطلاعات موجود در صفحات وب و سایر منابع، مطرح می شود. پرس وجوهای کاربران معمولاً «بسیار کوتاه» و شامل دو یا سه کلمه می باشند. قابلیت زبان های مختلف در بیان یک مفهوم با چندین کلمه مترادف و وجود یک کلمه با بیش از یک معنی، منجر به مشکل «عدم تطابق کلمه» و «مبهم بودن پرس وجو» می شوند. در نتیجه تعداد زیادی اسناد غیرمرتبط بازیابی شده و دقت کاهش می یابد. برای رفع این مشکلات از تکنیک گسترش پرس وجو استفاده می شود که از طریق پیشنهاد و افزودن واژگان مناسب به پرس وجوی کاربر، موجب بهبود دقت بازیابی خواهد شد. مهمترین مسئله، تشخیص و انتخاب واژه خوب برای افزودن به پرس وجوی کاربر می باشد. در مباحث گسترش پرس وجو دو عامل مهم «روش انتخاب واژگان گسترش» و «منابع واژگان گسترش» وجود دارد. در این پایان نامه با درنظر گرفتن ویژگی های زبان فارسی و مسائل مرتبط با آن، به بررسی گسترش پرس وجو در موتور جستجوی فارسی می پردازیم. برای این کار از هستان شناسی عمومی فارس نت و شبکه مفهوم استفاده می کنیم که در برگیرنده روابط میان مفاهیم و کلمات می باشد. پس از دریافت پرس وجوی کاربر از طریق مطابقت آن با شبکه مفهوم، گروهی از کلمات مرتبط با پرس وجوی کاربر استخراج می شوند و در مرحله بعد مطابق الگوریتم ارائه شده، رتبه بندی می شوند. در پایان تعدادی از کلمات بسیار مرتبط با پرس وجوی کاربر به صورت خودکار به پرس وجوی اولیه کاربر افزوده می شوند و پرس وجوی گسترش یافته مورد جستجو قرار می گیرد. نتایج آزمایش های انجام شده، نشان دهنده بهبود عملکرد و افزایش دقت بازیابی می باشد.