نام پژوهشگر: شیدا دیانی دردشتی

ارائه روشی بهبود یافته برای تکرار داده سلسله مراتبی پویا در سیستم های گرید داده ای
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه شیخ بهایی - دانشکده کامپیوتر و فناوری اطلاعات 1392
  شیدا دیانی دردشتی   محمد رضا خیام باشی

پردازش گرید، یکی از انواع پردازش توزیع شده می باشد که در آن منابع مختلف کامپیوتری توسط سازمان های مختلف به اشتراک گذاشته می شوند تا یک کامپیوتر مجازی با قدرت زیاد ایجاد شود و برای حل مسائل پیچیده داده ای و محاسباتی آن سازمان ها به کار گرفته شود. گرید امروزه به عنوان یک فناوری حیاتی برای اجرای برنامه های با کارایی بالا مطرح شده است و با پیشرفت فن آوری، پروتکل ها و بسترهای آن بی تردید در آینده استفاده از آن فراگیرتر خواهد شد. منابع به اشتراک گذاشته شده در گرید، عموماً ناهمگن بوده و به صورت جغرافیایی توزیع شده هستند. تکرار داده از معروف ترین استراتژی هایی است که در سیستم های توزیع شده به منظور بهبود دستیابی به داده و بدست آوردن سطح بالایی از دسترس پذیری، تحمل پذیری خرابی و قابلیت اطمینان سیستم استفاده می شود. به همین منظور از این روش برای مدیریت داده ها در سیستم های گرید داده ای نیز استفاده می شود. استراتژی های تکرار داده، وابسته به این مسئله می باشند که تکرار کجا، چه زمانی، چگونه ساخته شده و چگونه از بین برود. امروزه با وجود تمام تحقیقات صورت گرفته در زمینه تکرار پویای داده ها در محیط های گرید، هنوز چالش های زیادی از قبیل بالا بودن زمان اجرای کارها، تاخیر زیاد در دسترسی به فایل ها، محدود بودن تعداد و ظرفیت منابع ذخیره سازی در دسترس و عدم استفاده ترکیبی از استراتژی های تکرار و زمان بندی مطرح می باشند. در این پژوهش هدف ارائه استراتژی تکرار داده جدیدی به نام rdt می باشد. اغلب الگوریتم های ارائه شده، در هر مرحله فقط یک تکرار از فایل ایجاد می کنند؛ در صورتی که ممکن است تعداد درخواست ها به آن فایل به حدی زیاد باشد که عدم ایجاد تکرار به تعداد مناسب سبب کاهش کارایی و افزایش مصرف پهنای باند شود. بنابراین، تعیین یک حد آستانه پویا جهت مشخص کردن مناسب ترین تعداد تکرار برای فایل تقاضا شده با توجه به شرایط موجود در محیط گرید، موجب کاهش زمان اجرا و افزایش کارایی خواهد شد. همچنین، تکرار فایل در تمامی سایت هایی که درخواست فایل را داده اند ایجاد نمی شود، بلکه به کمک استراتژی پیشنهادی این پژوهش، تکرار فقط در سایت هایی که به صورت پویا مناسب شناخته می شوند ایجاد خواهد شد و در نتیجه هزینه ذخیره سازی و میانگین زمان اجرای کار کاهش خواهد یافت. استرات‍ژی تکرار داده ای که در این پژوهش ارائه خواهد شد، با استفاده از الگوریتم زمان بندی پیشنهادی، کارایی قابل قبولی خواهد داشت و قابل استفاده در محیط های واقعی گرید می باشد. در نهایت روش ارائه شده در یک محیط شبیه ساز گرید با پارامترهای مشابه گریدهای واقعی مورد بررسی و ارزیابی قرار خواهد گرفت.