نام پژوهشگر: مجید سازوار

استنتاج مقیاس پذیر بر روی پایگاه های دانش پویای مبتنی بر rdfs/owl
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1390
  مجید سازوار   محمود نقیب زاده

در طی سالیان اخیر حجم زیادی از سه گانه های rdf (در حدود چند ده میلیارد) در وب منتشر گردیده است. برای استفاده از این داده های منتشر شده باید الگوریتم استنتاجی داشته باشیم که بتواند روی این حجم عظیم از داده ها استنتاج انجام دهد و همچنین بتواند خود را با این نرخ بالای رشد ، تطبیق دهد. تاکنون راهکارهای مختلفی برای حل این مشکل ارائه گردیده است که برخی از آنها توانسته اند ، مقیاس پذیری خوبی را از خود نشان دهند. متاسفانه اکثر این روش ها برای حل مشکل مقیاس پذیری فرض کرده اند که داده ها ایستا می باشد و از روش استنتاج رو به جلو برای محاسبه بستار استفاده کرده اند. بنابراین تاکنون توجه کمی به مساله پویایی داده ها در وب معنایی شده است. در این پایان نامه ، روش ترکیبی ارائه شده است که تلاش می کند مزایای روش های استنباطی و استقرایی را یکجا جمع کرده و مشکلات آنها را از بین ببرد. در این روش ترکیبی ، از استنتاج رو به عقب برای فراهم سازی مجموعه داده آموزشی جهت یادگیری یک مدل lda استفاده شده است و سپس با استفاده از مدل یادگرفته شده ، صحت سه گانه های دیگر تخمین زده شده است. در راستای عملکرد کارآمد و مقیاس پذیر این روش یک ساختمان داده بیتی فشرده طراحی شده است که سه گانه های rdf را به طور فشرده ای درون حافظه اصلی بازنمایی می کند. نتایج بدست آمده از ارزیابی های مختلف بر روی این روش نشان از موفقیت این روش در راه رسیدن به اهداف خود دارد.