نام پژوهشگر: فاطمه عبیری

ارائه یک روش شاخص گذاری مقیاس پذیر و مبتنی بر موجودیت بر روی داده های rdf
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی کامپیوتر 1392
  فاطمه عبیری   محسن کاهانی

ظهور وب معنایی و استقبال گسترده از آن در سال های اخیر، باعث شده است که توسعه دهند گان وب، تلاش های بسیاری را در جهت سازماندهی داده های معنایی انجام دهند.با افزایش حجم داده های معنایی، یکی از مهمترین چالش های موجود در سازماندهی این داده ها، ارائه روشی مقیاس پذیر برای ذخیره و بازیابی آنها است. در این پایان نامه یک روش مقیاس پذیر برای شاخص گذاری داده های rdfپیشنهاد شده است. از آنجایی که یک سیستم شاخص گذاری از دو بخش ذخیره و بازیابی داده تشکیل می شود، در یک سیستم شاخص گذاری مقیاس پذیر، علاوه بر ذخیره ی داده های حجیمrdf، فرایند بازیابی داده ها را نیز باید به طور موثری برای کاربران مهیا نمود. به منظور ایجاد مقیاس پذیری در روش شاخص گذاری پیشنهادی، از پایگاه داده ی hbaseکه یکی از پایگاه داده های nosqlاست، استفاده شده است.hbase با فراهم نمودن امکان دسترسی تصادفی به داده های حجیم روی چارچوب توزیع شده hadoopمی تواند گزینه مناسبی برای مدیریت داده های حجیم وب باشد. همچنین طبق آمارهای اخیر، اکثر کاربران در پرس و جو های خود به دنبال یک موجودیت با مجموعه صفات مشخص هستند. در روش پیشنهادی، هدف پاسخگویی موثر به این نوع از پرس و جو ها است.از این رو یک الگوریتم خوشه بندی جهت گروه بندی موجودیت های مشابه، ارائه شده است و به ازای هر یک از خوشه های بدست آمده، یک جدول در پایگاه داده ایجاد می شود.نتایج ارزیابی نشان می دهد که روش پیشنهادی در بازیابی داده های rdf موفق بوده است.