نام پژوهشگر: الهام غفارزاده ینگجه

بازیابی اسناد علمی با توجه به گراف استناد آنها
پایان نامه دانشگاه تربیت معلم - تهران - دانشکده فنی 1392
  الهام غفارزاده ینگجه   میر محسن پدرام

با پیشرفت دانش و توسع? نشریات، یافتن کارهای مرتبط انجام شده بسیار دشوار شده است. امروزه میلیون ها مقاله در هزاران مجله و کنفرانس به چاپ رسیده است و هر روز به این تعداد افزوده می شود. با توجه به رشد صعودی نشریات، نیاز به روش های کارا برای جستجوی مطالب مرتبط، بیش از پیش احساس می شود. استفاده از کتابخانه های دیجیتال رایج با مشکلات مختلفی نظیر ناکارآمدی جستجوی مبتنی بر کلمات کلیدی و ضعف معیارهای شباهت متنی مواجه است. علاوه بر آن، برای برخی محققان مشخص کردن نیاز خود به اطلاعات در غالب چند کلمه کلیدی دشوار است. در حالی که مشخص کردن پرس و جو در قالب یک مقاله، به جای مجموعه ای از کلمات کلیدی، راهی ساده تر و ایده آل تر به نظر می رسد. برخی از سیستم های بازیابی اسناد علمی، برای غلبه بر ضعف های معیارهای شباهت متنی، از روابط استنادی بین مقالات استفاده می کنند. اما این سیستم ها نیز ضعف های خود را دارند، از جمله اینکه ممکن است در یک مقاله به بسیاری از مقالات مرتبط ارجاع داده نشده باشد. در این پژوهش، روشی برای بازیابی اسناد علمی بر اساس گراف استناد آنها و با در نظر گرفتن ویژگی های متنی مقالات ارائه شده است. رسته های لغات موجود در هر مقاله با استفاده از هستان نگار odp استخراج شده است تا به جای تطابق لغوی، از تطابق معنایی آنها استفاده شود. همچنین، معیار جدیدی برای محاسبه میزان ربط دو سند علمی با در نظر گرفتن روابط استنادی مقالات و رسته های به کار رفته در آنها ارائه شده است. ارزیابی های انجام شده نشان می دهد که معیار مورد نظر در محاسبه میزان ربط اسناد موفق است و سیستم ارائه شده بسیار کاراتر از سایر الگوریتم های مقایسه شده با آن عمل می کند.