نتایج جستجو برای: الگوریتم یادگیری تقویتی فازی
تعداد نتایج: 52714 فیلتر نتایج به سال:
امروزه تحقیقات گسترده ای در زمینه کاهش مصرف انرژی در بخش سیستم های تهویه مطبوع صورت می پذیرد و تنظیم دقیق این سیستم ها مورد توجه قرار گرفته است. سیستم های تهویه مطبوع علیرغم وجود پیچیدگی می بایست شرایط حرارتی مطلوب را تأمین کنند. در این سیستم ها کنترلر می بایست قابلیت تطبیق با تغییرات پارامترهای محیطی را داشته باشد. در بیشتر سیستم های تهویه مطبوع امروزی از کنترلرهای روشن/خاموش (ترموستات) و در ...
بازیهای دیفرانسیلی امروزه کاربردهای گسترده در زمینه های مختلف از جمله سیستمهای مخابرات بیسیم و شبکه، سیستمهای اقتصادی و راهبرد های دفاعی یافته اند. حل بازیهای دیفرانسیلی تکیه بر حل معادلات همیلتون-جاکوبی دارد. حل این معادلات در حالت غیرخطی بسیار مشکل بوده و ممکن است حتی در موارد ساده فاقد حل تحلیلی سرتاسری باشند. اکثر روش¬های ارائه شده برای حل این معادلات، روشهای تقریبی برون خطی هستند که در آنه...
برای بسیاری سیستم ها، توانایی یادگیری یک مزیت مهم و حتی در بعضی موارد یک نیاز است. از ابتدا، برای ایجاد توانایی یادگیری دو ایده کلی بسیار مورد توجه بوده است. ایده اول که به یادگیری با نظارت منجر می شود، استفاده از زوج های آموزشی ورودی-خروجی است. در این نوع یادگیری، سعی بر آموزش عملکرد درست به سیستم، با تعدادی مثال است که هر مثال شامل خروجی مورد انتظار از سیستم برای یک ورودی معین است. ایده دیگر ...
یادگیری تقویتی، نگاشت وضعیت ها به عمل ها با هدف ماکزیمم کردن سیگنال پاداش دریافتی را بررسی می کند. در این نوع یادگیری، به عامل گفته نمی شود که چه عملی را انتخاب کند، بلکه عامل باید عملی را انتخاب کند که پاداش دریافتی از محیط را بیشینه کند. در چالش برانگیزترین حالات، پاداش عمل ها بلافاصله مشخص نمی شود. یادگیری تقویتی، از یک سو دارای پشتوانه قوی از قضایا و اثبات های ریاضی است؛ و از سویی دیگر، این...
هدف: معاملات زوجی از معروفترین و قدیمیترین سیستمهای معاملات الگوریتمی است که کارایی و سودآوری آن در بسیاری از پژوهشهایی که تاکنون در بازارهای مالی مختلف صورت گرفته است، اثبات و نشان داده شده است. مهمترین اصل در معاملات زوجی، وجود روابط تعادلی بلندمدت یا همان خاصیت بازگشت به میانگین است. از طرفی در سالهای اخیر تحقیقات شایان توجهی روی معاملات الگوریتمی با استفاده از یادگیری ماشین صورت گرفت...
افزایش روزافزون سیستمهای کنترل در بسیاری از کاربردها ، منجر به روشهای متنوع کنترلی شده است. استفاده از منطق و سیستمهای کنترل فازی به علّت توصیف تقریبی قابل قبول و قابل تجزیه و نیز تحلیل یک مدل و همچنین به فرمول در آوردن دانش و معرفت بشری ، توانسته است که در بین انواع سیستمهای کنترل جایگاه مناسبی پیدا کند. اگرچه سیستمهای فازی پدیده های غیر قطعی و نامشخصی را توصیف می کنند ، با این حال خود تئوری فا...
این مقاله به معرفی بازی های گرافی دیفرانسیلی برای سیستم های چند عاملی غیر خطی زمان پیوسته می پردازد و یک روش بهینه توزیع شده برخط برای حل آنها پیشنهاد می کند. در بازی های گرافی دیفرانسیلی، دینامیک خطا و اندیس عملکرد هر بازیکن تنها بستگی به اطلاعات همسایگان محلی آن عامل دارد. الگوریتم تکرار سیاست توزیع شده پیشنهاد شده، حل تقریبی معادلات همیلتون-جاکوبی کوپل شده همکارانه متعلق به عامل های غیر خطی...
در یادگیری تیمی و هنگامی که مجموعه ای از عامل ها در کنار یکدیگر به یادگیری می پردازند، زمانی می توان یادگیری مناسبی داشت که در آن میزان کارایی هر عامل مشخص باشد و بتوان نقش عاملهای مختلف را به دستی در تیم تعییین کرد. در این صورت می توان براساس نقش و میزان تاثیرگذاری عامل در کار گروهی تیم به وی امتیاز داد. در تحقیقاتی که تاکنون انجام شده است نقش همه عاملهای شرکت کننده در یادگیری را یکسان فرض کرد...
ساختار رقابت مابین تأمین کنندگان انرژی در بخش تولید بازارهای برق منجر به آن شده است که شرکت های تولید با اتخاذ تصمیمات استراتژیک به دنبال حداکثرسازی سودشان باشند. در این راستا، شرکت های تولید سعی می کنند که از طریق ارائه قیمتی مناسب در سطحی بالاتر از هزینه های حدی خود، در رقابت با سایر تولیدکنندگان سهم بیش تری از تأمین انرژی الکتریکی بازار برق را کسب نمایند. هدف این مقاله پیشنهاد یک روش مبتنی ب...
نمودار تعداد نتایج جستجو در هر سال
با کلیک روی نمودار نتایج را به سال انتشار فیلتر کنید