نام پژوهشگر: مینا معمار

کاوش الگوهای تکرار شونده در جریانهای داده
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده برق و کامپیوتر 1390
  مینا معمار   محمدهادی صدرالدینی

یافتن دسته داده های تکراری در جریان پیوسته تراکنشها یکی از مسائل حیاتی در کاربردهایی نظیر تحلیل سبد خرید، مانیتورینگ شبکه و پیش‎بینی فروش انبار می باشد. پنجره لغزان یکی از مدلهایی است که به دلیل مدیریت تغییر محتوا، مصرف حافظه محدود و سرعت پردازش کم به شکل گسترده در یافتن دسته داده های تکراری در جریانهای داده استفاده شده است. یک الگوریتم مبتنی بر مدل پنجره ای لغزان به یک ساختمان داده کارا احتیاج دارد که به سریعترین شکل ممکن با حذف و درج تراکنشها خود را به روز کند. به علاوه یک روش محاسباتی ابداعی نیز لازم است تا با تاخیر اندکی بعد از درخواست کاربر جهت مشاهده نتایج کاوش در یک پنجره، مجموعه دسته داده های تکراری را تولید کند. در این پایان نامه یک ساختمان داده کارا با نام دنباله بیتی بلوک بندی شده برای ذخیره و نگهداری محتویات پنجره معرفی شده است. به علاوه با یک تکنیک جدید این پنجره مورد پویش قرار گرفته تا مجموعه دسته داده های تکراری در پنجره جاری به شکلی کارا استخراج شوند. نتایج آزمایشات روی جریان داده های واقعی و مصنوعی نشان می دهد که این الگوریتم سریعتر از الگوریتمهایی است که اخیرا در زمینه کاوش جریانهای داده ارائه شده اند.