امین اله مهابادی

نام پژوهشگر: امین اله مهابادی

ارتقاء کیفیت سیستم های بازیابی اطلاعات متنی با استفاده از الگوریتم های خوشه بندی اسناد

پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه شاهد - دانشکده فنی و مهندسی 1390
محسن خزایی امین اله مهابادی

سیستم های بازیابی اطلاعات، با استفاده از یک استراتژی بازیابی خودکار تلاش می کنند اسناد مرتبط بیشتری را برای کاربر نمایان ساخته به نحوی که تا حد ممکن هیچ سند غیر مرتبطی بازیابی نگردد. در شاخه بازیابی اطلاعات، ارزیابی سیستم بازیابی اطلاعات نقشی اساسی ایفا می کند. در این خصوص، ارزیابی میزان کیفیت و اثربخشی بازیابی مهمترین نوع ارزیابی سیستم می باشد که تعیین کننده آن است که یک سیستم یا الگوریتم، تا چه اندازه قادر به انطباق، بازیابی و رتبه بندی اسنادی است که به نیاز اطلاعاتی کاربر مرتبط می باشد. هرچه تعداد اسناد مرتبط بازیابی شده توسط سیستم بیشتر و تعداد اسناد نامرتبط کمتر باشد، رضایت کاربر بالاتر بوده و میزان کیفیت سیستم بیشتر خواهد بود. در این پژوهش برای افزایش میزان دقت و اثربخشی سیستم بازیابی اطلاعات از روش های خوشه بندی اسناد استفاده شده، به ترتیبی که سعی می گردد قبل از این که کاربر نیاز اطلاعاتی خود را در قالب یک پرس و جو بیان نماید، اسناد داخل مجموعه به چندین گروه تقسیم شود بطوری که اسناد داخل یک خوشه نسبت به هم دارای بیشترین مشابهت بوده و در عین حال بیشترین فاصله را نسبت به اسناد سایر خوشه ها دارا باشند. بدین ترتیب، پرس و جوی کاربر ابتدا به نزدیک ترین خوشه مرتبط شده، سپس تنها اسناد داخل آن خوشه با توجه به میزان مشابهتشان با پرس و جو، رتبه بندی و در نتایج سیستم بازیابی ظاهر می گردند. بدین ترتیب اسنادی که از لحاظ ظاهری و لغوی شباهت چندانی با پرس و جو نداشته اما از نظر محتوی، نیاز اطلاعاتی کاربر را برآورده می سازند نیز در نتایج جستجو ظاهر می گردند. برای این منظور روش خوشه بندی جدیدی با استفاده از الگوریتم یافتن تطابق ماکزیمم در گراف دوبخشی معرفی شده و نشان می دهیم خوشه بندی اسناد و اعمال آن در سیستم بازیابی اطلاعات به بهبود نتایج در مقایسه با سیستم های سنتی می انجامد. بمنظور ارزیابی روش خوشه بندی و مقایسه آن با روش های موجود، از پیکره های استاندارد 20newsgroups، webkb و reuters 21578 و یک پیکره ساختگی استفاده شده است. همچنین جهت مقایسه سیستم بازیابی اطلاعات مبتنی بر خوشه بندی با روش سنتی، از پیکره استاندارد cranfield استفاده شده است. نتایج بدست آمده نشان می دهد روش خوشه بندی پیشنهادی دارای خروجی مطلوبی بوده و استفاده از آن در سیستم بازیابی اطلاعات، منجر به افزایش میزان دقت سیستم، در مقایسه با حالت سنتی خواهد شد.

۱۵ صفحه ی اول

پیش بینی لینک در شبکه های اجتماعی

پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه شاهد - دانشکده فنی 1392
اسماعیل بسطامی امین اله مهابادی

با توسعه سریع شبکه های اجتماعی، تعیین دورنمای نیازهای آتی برای تحلیل و پیش بینی های لازم از نظر کاهش مخاطرات و افزایش دقت و صحت در تصمیم سازی، نیازمند مدل سازی مقیاس پذیر و انتخاب الگوریتم های سریع و دقیق است. برای اطمینان از درک فعل و انفعالات شبکه، گزینش الگوریتم مناسب در استفاده از دانش ساختاری شبکه به جای دانش رفتاری بسیار مشکل است. این امر نیاز به فرآیند یادگیری تغییرات شبکه در زمان های متوالی را حذف و امکان پیش بینی سریع در دو زمان متوالی تصمیم گیری را برای داده های حجیم فراهم می کند. ما در این مقاله روش توزیعی مقیاس پذیر جدیدی برای پیش بینی دقیق لینک در شبکه های اجتماعی با استفاده از ویژگی های ساختاری آن شبکه ها و بدون هیچ نیازی به سابقه گیری ارایه می دهیم که ضمن مدل سازی عامل گرای مساله و انتخاب انجمن ها، از الگوریتم جستجوی گرانشی برای تشخیص لینک های مقتضی بین انجمن ها بهره می برد. نتایج ارزیابی آزمایش ها نشان می دهد که عملکرد روش پیشنهادی در سناریوهای مجموعه داده ای مختلف شبکه، مقیاس پذیر و از دقت میانگین77درصد و صحت میانگین 75درصد برخوردار است. ضمنا با داشتن ساختار توزیعی و با برخورداری از پاسخ زمانی مناسب، در صورت انتخاب بهینه عامل ها و تخصیص مناسب پردازنده به آن ها، با بهبود زمان پاسخ و افزایش قدرت مقیاس پذیری مواجه خواهد شد.