کنترل بهینه توزیع شده بازی های گرافی دیفرانسیلی غیر خطی به صورت برخط با استفاده از یادگیری تقویتی

نویسندگان

فرزانه تاتاری

farzaneh tatari electrical eng. departmentگروه مهندسی برق محمد باقر نقیبی سیستانی

mohammad-b naghibi-s electrical eng. departmentگروه مهندسی برق

چکیده

این مقاله به معرفی بازی های گرافی دیفرانسیلی برای سیستم های چند عاملی غیر خطی زمان پیوسته می پردازد و یک روش بهینه توزیع شده برخط برای حل آنها پیشنهاد می کند. در بازی های گرافی دیفرانسیلی، دینامیک خطا و اندیس عملکرد هر بازیکن تنها بستگی به اطلاعات همسایگان محلی آن عامل دارد. الگوریتم تکرار سیاست توزیع شده پیشنهاد شده، حل تقریبی معادلات همیلتون-جاکوبی کوپل شده همکارانه متعلق به عامل های غیر خطی را به صورت برخط انجام می دهد. در این الگوریتم که بر مبنای یادگیری تقویتی طراحی شده، هر یک از بازیکنان از ساختار شبکه عصبی نقاد-کنترلر استفاده می کند و تنظیم وزن های شبکه های عصبی نقاد و کنترلر به صورت همزمان انجام می شود. در حالی که تمام شبکه های عصبی نقاد-کنترلر در حال یادگیری هستند، پایداری حلقه بسته و همگرایی به قوانین کنترل بهینه تضمین می گردد. در انتها، نتایج به دست آمده از شبیه سازی، عملکرد و صحت الگوریتم پیشنهادی را نشان می دهد.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

حل برخط بازی های دیفرانسیلی افق نامحدود برای سیستم های دینامیک-نامعین زمان-پیوسته با استفاده از الگوریتم های یادگیری تقویتی

بازیهای دیفرانسیلی امروزه کاربردهای گسترده در زمینه های مختلف از جمله سیستمهای مخابرات بیسیم و شبکه، سیستمهای اقتصادی و راهبرد های دفاعی یافته اند. حل بازیهای دیفرانسیلی تکیه بر حل معادلات همیلتون-جاکوبی دارد. حل این معادلات در حالت غیرخطی بسیار مشکل بوده و ممکن است حتی در موارد ساده فاقد حل تحلیلی سرتاسری باشند. اکثر روش¬های ارائه شده برای حل این معادلات، روشهای تقریبی برون خطی هستند که در آنه...

اثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین

Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...

متن کامل

اثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین

Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...

متن کامل

کنترل غیر خطی یک فرآیند هیبریدی فتوولتائیک/باتری با استفاده از کنترل مد لغزشی

در این مقاله، مسأله‌ی کنترل یک فرآیند هیبریدی تشکیل‌شده از آرایه‌ی خورشیدی، باتری و مدار سوئیچینگ در نظر گرفته می‌شود. ابتدا فرآیند مورد نظر مدل‌سازی می‌شود. مدل‌سازی طی سه مرحله انجام می‌شود. در مرحله‌ی اول مدار سوئیچینگِ فرآیند توسط روش متوسط گیری فضای حالت مدل‌سازی می‌شود. در مرحله‌ی دوم آرایه‌ی خورشیدی توسط روش تک دیودی با مقاومت سری مدل‌سازی می‌شود. در مرحله‌ی سوم نیز باتری توسط روش تونن مد...

متن کامل

کنترل همزمان شتاب و تغییرمکان لرزه ای سازه های نامتقارن خطی و غیر خطی با استفاده از میراگرهای جرمی

آسیب پذیری سازه های نامتقارن در اثر زلزله ناشی از تغییر شکلهای پیچشی اضافی است که بهعلت نامتقارنی ایجاد می گردد. تحقیقات اخیر نشان داده است که میراگر جرمی تنظیم شده می تواندپاسخ تغییرمکان حداکثر این سازه ها را به طور مناسبی کاهش دهد. ولی در اکثر سازه ها کاهشهمزمان شتاب و تغییرمکان دو لبه از اهمیت بالایی برخوردار است. همچنین کنترل پیچش در این سازهها با نزدیک نمودن تغییرمکان دو لبه پلان به هم و ن...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید


عنوان ژورنال:
کنترل

جلد ۸، شماره ۴، صفحات ۱۵-۳۰

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023