روشی کارا برای کنترل ازدحام در شبکه های کامپیوتری با استفاده از یادگیری تقویتی فازی و نظریه بازی

پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه محقق اردبیلی - دانشکده فنی
نویسنده محمد باقر صفری پور فتیده
استاد راهنما شهرام جمالی مرتضی آنالویی
سال انتشار 1393

چکیده

بحث کنترل ازدحام از اهمیت ویژه ای در مباحث مربوط به شبکه های کامپیوتری برخوردار است. کنترل ناکارآمد ازدحام در شبکه، به آسانی منجر به از کار افتادن شبکه می-شود. یادگیری تقویتی که از داده ها می آموزد همراه با سیستم استنتاج فازی، ابزار هایی عالی برای حل مشکل کنترل ازدحام در شبکه های کامپیوتری با آن طبیعت پیچیده اش هستند.aimd هسته ی مکانیزم اجتناب از ازدحام برای این استاندارد های tcp است. در حالت اجتناب از ازدحام برپایه ی aimd، اندازه پنجره به مقدار ? برای هر پنجره ای از بسته های تایید شده، افزایش می یابد و هنگامی که نشانه ای از ازدحام موجود باشد به میزان ? از مقدار کنونی کاهش می یابد (در reno ?=1 و?=1/2 ). در این پایان نامه ما با استفاده از یادگیری تقویتی فازی، اجتناب از ازدحام در newreno را در انتخاب مقادیر مناسب ? و? با توجه به وضعیت شبکه بهبود می بخشیم. کنترل گر پیشنهادی ما مشکل کاوش مهاجمانه و شدید tcp استاندارد که نتیجه اش تغییرات شدید در اندازه ی پنجره ازدحام که باعث نامناسب شدن این الگوریتم برای کاربرد های چندرسانه ای می شود، را حل می کند.ما نشان داده ایم که اگر همه ی میزبان های انتهایی الگوریتم کنترل ازدحام پیشنهادی ما را بکار گیرند ما تعادل نش خواهیم داشت، به علاوه با شبیه سازی در ns2 نشان داده ایم که در این تعادل نش کارایی شبکه کمی بهتر از زمانی است که تمامی میزبان های انتهایی از newreno استفاده کنند.

منابع مشابه

روشی نوین برای یادگیری تقویتی فازیِ باناظر برای ناوبری ربات

: استفاده از یادگیری باناظر در ناوبری ربات های متحرک، با چالش های جدی از قبیل ناسازگاری و اختلال در داده ها، مشکل جمع آوری نمودن داده آموزش و خطای زیاد در داده های آموزشی مواجه می باشد. قابلیت های یادگیری تقویتی همچون عدم نیاز به داده آموزشی و آموزش تنها با استفاده از یک معیار اسکالر راندمان باعث کاربرد آن در ناوبری ربات شده است. از طرفی یادگیری تقویتی زمانبر بوده و دارای نرخ شکست های بالا در م...

متن کامل

کنترل بهینه توزیع شده بازی های گرافی دیفرانسیلی غیر خطی به صورت برخط با استفاده از یادگیری تقویتی

این مقاله به معرفی بازی های گرافی دیفرانسیلی برای سیستم های چند عاملی غیر خطی زمان پیوسته می پردازد و یک روش بهینه توزیع شده برخط برای حل آنها پیشنهاد می کند. در بازی های گرافی دیفرانسیلی، دینامیک خطا و اندیس عملکرد هر بازیکن تنها بستگی به اطلاعات همسایگان محلی آن عامل دارد. الگوریتم تکرار سیاست توزیع شده پیشنهاد شده، حل تقریبی معادلات همیلتون-جاکوبی کوپل شده همکارانه متعلق به عامل های غیر خطی...

متن کامل

کنترل مود لغزشی برای ازدحام در شبکه های TCP/IP

In this paper a new sliding mode controller for congestion problem in TCP networks has been proposed. Congestion occurs due to high network loads. It affects some aspects of network behavior. Congestion control prevents or reduces loads in bottlenecks and manages traffic. By using control theory, closed loop data transfer processing structure in computer networks can cope with the congestion p...

متن کامل

تقریب تابع ارزش عمل با استفاده از شبکه توابع پایه شعاعی برای یادگیری تقویتی

مشکل تنگنای ابعاد، یکی از چالش هایی است که کاربرد الگوریتم های یادگیری تقویتی گسسته را در مورد مسائل کنترلی واقعی که دارای فضای حالت و عمل بزرگ و یا پیوسته می باشند محدود نموده است. ترکیب روش های آموزشی گسسته با تقریب زننده های تابعی برای حل این مشکل چندی است مورد توجه محققان قرارگرفته است. در همین راستا در این مقاله یک الگوریتم جدید یادگیری تقویتی عصبی (NRL) بر مبنای معماری نقاد- تنها معرف...

متن کامل

کنترل ازدحام در شبکه های کامپیوتری با استفاده از شبکه عصبی با خط تاخیر زمانی

ازدحام در شبکه های رایانه ای پدیده ای نامطلوب است که طی آن با افزایش بی وقفه ی تقاضای کاربران، عملکرد طبیعی شبکه مختل شده و سرویس دهی مناسب صورت نمی پذیرد. در سال های اخیر تحقیقات وسیعی پیرامون استراتژی های کنترل ازدحام برای افزایش کیفیت سرویس و کارایی شبکه های رایانه ای صورت گرفته است. مسیریاب ها با مدیریت صحیح صف بسته ها، می توانند نقش اساسی در زمینه ی ارتقای کیفیت سرویس برعهده داشته باشند. ح...

15 صفحه اول

کنترل بهینه توزیع شده بازی های گرافی دیفرانسیلی غیر خطی به صورت برخط با استفاده از یادگیری تقویتی

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}

نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه محقق اردبیلی - دانشکده فنی

کلمات کلیدی

تکثیر ازدحام اکتشاف بازخورد

میزبانی شده توسط پلتفرم ابری doprax.com