الهه سخاوتی

نام پژوهشگر: الهه سخاوتی

ارائه چارچوبی جهت انتشار اطلاعات کتابخانه بر پایه اصول داده های پیوندی

پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - دانشکده علوم پایه 1390
الهه سخاوتی احمد فراهی

بدون شک، هدف نهایی وب معنایی ایجاد "وبی از داده های ساختارمند مرتبط" است. به عبارت دیگر، در وب معنایی تلاش اصلی بر این است که به مردم کمک شود به همان سادگی که اسناد را به اشتراک می گذارند، داده های ساختارمند را نیز به اشتراک بگذارند. دسترسی و مبادله اطلاعات کتابها بین گروه های مختلف کاربران وب از جمله دانشجویان، اساتید و محققین از اهمیت بالایی برخوردار است. با این وجود، ارائه این اطلاعات از طریق پرتالها و وب سایتهای مختلف بصورت صفحات وب پاسخگوی نیازهای کاربران نمی باشد. زیرا اولاً به دلیل یکسان نبودن ساختار اطلاعات و همچنین زبان ارائه اطلاعات، تبادل و به اشتراک گذاری این اطلاعات کار پیچیده ای است. ثانیا، بکارگیری آن توسط ماشین ممکن نیست. یکی از اهداف اصلی این تحقیق، به نوعی همان هدف اصلی داده های پیوندی است. به عبارت دیگر، در این تحقیق تلاش می شود با انتشار اطلاعات موجود در صفحه وب به صورت داده های پیوندی یک مکانیزم دسترسی استاندارد واحد فراهم شود. به عبارت دیگر، هدف کلی این تحقیق ارائه چارچوبی کارا، جهت انتشار اطلاعات کتابها (از قبیل: عنوان، نویسنده، ناشر،... ) بر پایه اصول داده های پیوندی است، به نحوی که به راحتی بتوان به پرس و جوهای معنایی و سناریوهای مختلف پاسخ داد. این چارچوب داده های اولیه را به صورت رابطه ای دریافت می کند و پس از انجام عملیات پاکسازی بر روی داده ها و افزایش کیفیت داده ها جهت انتشار، آنها را به فرمت rdf تبدیل کرده، در مخزن سه گانه های rdf ذخیره می نماید. در مرحله بعد، سه گانه های ایجاد شده را با منابع خارجی لینک می نماید. وجود نمایشهای مختلف داده های منتشر شده به صورت داده های پیوندی کمک شایانی به کاربرانی می باشد که آشنایی چندانی با مسائل تخصصی رایانه ندارند. از این رو، چارچوب طراحی شده علاوه بر انتشار داده ها به صورت rdf، فرمت html داده ها را نیز برای کاربران فراهم می کند و بر روی سرور قرار می دهد، بطوریکه با درخواست کاربر از مرورگر، از روی سرور بازیابی شده و در مرورگر کاربر بارگذاری می شود. یکی از مسائل اساسی در انتشار داده ها به صورت داده های پیوندی، مسئله تطابق موجودیتها و شناسایی موجودیتهای مشابه است. با وجود اینکه تا کنون راهکارهایی برای این مسئله مطرح شده است، اما هنوز هم یک راه حل کامل و جامع ارائه نشده است. در زمان طراحی چارچوب، الگوریتمهای تطابق رشته مختلف و در نهایت تطابق موجودیتها به کار گرفته شد و مناسبترین آنها جهت استفاده در چارچوب انتخاب شد. انتخاب یک الگوریتم تطبیق رشته مناسب تاثیر به سزایی بر روی نتایج حاصل از عملکرد چارچوب دارد. ارزیابی چارچوب پیشنهادی به صورت تجربی و با استفاده از یک مجموعه داده نمونه، انجام گرفته است و معیارهای مقبولیت نتایج قابل قبولی را ارائه می دهند. همچنین، نشان داده شد که انتشار اطلاعات آماری، ساختاری و ... توسط فایل void می تواند معیار مناسبی جهت تحلیل داده های منتشر شده توسط چارچوب موردنظر باشد.

۱۵ صفحه ی اول