نام پژوهشگر: فروغ شهابیان

گسترش پرس و جو ها با استفاده از بازخورد رابطه در بازیابی اطلاعات xml
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه اصفهان - دانشکده فنی و مهندسی 1389
  فروغ شهابیان   احمد براآنی

استفاده از xml بعنوان قالبی برای انتشار و مبادله اطلاعات فرصت مغتنمی برای بازیابی اطلاعات کارا می باشد. در بازیابی اطلاعات xml ای که داده ها شمای نا همگون، پیچیده و نا معلومی دارند، اغلب کاربران از پرس و جو های مبتنی بر محتوا استفاده می کنند. غالباً پرس و جو های کاربر از اطلاعات مهمی که در ساختار xml نهفته است بهره نمی برند و نیاز کاربر را نیز به طور کامل بیان نمی کنند. از این رو و به منظور بالا بردن کیفیت بازیابی ها، می توان پرس و جو ها را گسترش داد. استفاده از بازخورد رابطه کور تکنیکی موثر برای گسترش پرس و جو ها می باشد. بیشتر موتورهای بازخورد موجود در این نوع بازیابی ها، تنها از محتویات بازخورد کور بهره می برند در حالیکه روش ارائه شده در این رهآورد از اطلاعات ساختاری این بازخورد ها نیز استفاده می کند. در این پژوهش از بازخورد ها برای تشخیص بستر های مناسب واژگان گسترش پرس و جو که همان عنصر های هم زمینه ی پرس و جو می باشند، استفاده شده است. سپس این بسترها برای یافتن کلمات مناسب مورد کاوش قرار می گیرند. که این امر باعث صرفه جویی در هزینه می گردد. استفاده از عنصر های هم زمینه پرس و جو باعث کاهش پدیده خروج از تعادل می گردد. در این رهیافت به منظور تشخیص بستر های جستجو از شباهت معنایی عنصر های مرتبط با سایر عنصر ها استفاده شده است. برای تعیین شباهت های معنایی عنصر ها از چیدمان عنصر ها در درخت xml، ویژگی های ساختاری و محتویات متنی عنصر ها بهره گرفته شده است. در این رساله پس از تشخیص عنصر های هم زمینه پرس و جو، کلمات موجود درآنها با استفاده از تابع وزن دهی طراحی شده وزن دهی و سپس کلمات مناسب از بین آنها انتخاب می گردد. به منظور رفع ابهام پرس و جو، وزن اختصاص یافته به کلمات چند معنا کم می باشد تا بعنوان واژگان گسترش پرس و جو انتخاب نشوند. به این ترتیب پرس و جوی گسترش یافته ایجاد و عملیات جستجو با آن از سر گرفته می شود. این روش با در نظر گرفتن معیار دقت و میانگین دقت و فراخوانی روی مجموعه داده هایinex مورد ارزیابی قرار گرفته است. نتایج ارزیابی نشان دهنده ی افزایش نرخ دقت و میانگین دقت می باشد.