الگوریتم یادگیری تقویتی فازی

ارزیابی مقایسه‌ای رویکرد مارکویتز با یک روش ترکیبی به منظور تشکیل پرتفوی بهینه با کاربرد یادگیری عمیق DNN و الگوریتم جستجوی گرانشی

Journal: :Journal of Financial Managment Perspective 2019

طراحی کنترلر فازی مرتبه بالا برای سیستم های تهویه مطبوع

پایان نامه :دانشگاه آزاد اسلامی - دانشگاه آزاد اسلامی واحد گرمسار - دانشکده مهندسی برق 1391

امیر حسین بیهقی, علی اکبر قره ویسی, محمد رضا سلطان پور,

امروزه تحقیقات گسترده ای در زمینه کاهش مصرف انرژی در بخش سیستم های تهویه مطبوع صورت می پذیرد و تنظیم دقیق این سیستم ها مورد توجه قرار گرفته است. سیستم های تهویه مطبوع علیرغم وجود پیچیدگی می بایست شرایط حرارتی مطلوب را تأمین کنند. در این سیستم ها کنترلر می بایست قابلیت تطبیق با تغییرات پارامترهای محیطی را داشته باشد. در بیشتر سیستم های تهویه مطبوع امروزی از کنترلرهای روشن/خاموش (ترموستات) و در ...

حل برخط بازی های دیفرانسیلی افق نامحدود برای سیستم های دینامیک-نامعین زمان-پیوسته با استفاده از الگوریتم های یادگیری تقویتی

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1393

شعله یاسینی, علی کریم پور, محمدباقر نقیبی سیستانی,

بازیهای دیفرانسیلی امروزه کاربردهای گسترده در زمینه های مختلف از جمله سیستمهای مخابرات بیسیم و شبکه، سیستمهای اقتصادی و راهبرد های دفاعی یافته اند. حل بازیهای دیفرانسیلی تکیه بر حل معادلات همیلتون-جاکوبی دارد. حل این معادلات در حالت غیرخطی بسیار مشکل بوده و ممکن است حتی در موارد ساده فاقد حل تحلیلی سرتاسری باشند. اکثر روش¬های ارائه شده برای حل این معادلات، روشهای تقریبی برون خطی هستند که در آنه...

بررسی خصوصیات همگرایی روش های ترکیبی یادگیری تقویتی با تخمین تابع

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی کامپیوتر 1386

بابک به ساز, رضا صفابخش,

برای بسیاری سیستم ها، توانایی یادگیری یک مزیت مهم و حتی در بعضی موارد یک نیاز است. از ابتدا، برای ایجاد توانایی یادگیری دو ایده کلی بسیار مورد توجه بوده است. ایده اول که به یادگیری با نظارت منجر می شود، استفاده از زوج های آموزشی ورودی-خروجی است. در این نوع یادگیری، سعی بر آموزش عملکرد درست به سیستم، با تعدادی مثال است که هر مثال شامل خروجی مورد انتظار از سیستم برای یک ورودی معین است. ایده دیگر ...

15 صفحه اول

یادگیری تقویتی مبتنی بر نقشه خودسازمان ده تطبیقی با زمان

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی کامپیوتر 1385

حسام منتظری, رضا صفابخش,

یادگیری تقویتی، نگاشت وضعیت ها به عمل ها با هدف ماکزیمم کردن سیگنال پاداش دریافتی را بررسی می کند. در این نوع یادگیری، به عامل گفته نمی شود که چه عملی را انتخاب کند، بلکه عامل باید عملی را انتخاب کند که پاداش دریافتی از محیط را بیشینه کند. در چالش برانگیزترین حالات، پاداش عمل ها بلافاصله مشخص نمی شود. یادگیری تقویتی، از یک سو دارای پشتوانه قوی از قضایا و اثبات های ریاضی است؛ و از سویی دیگر، این...

15 صفحه اول

بهینه‎سازی استراتژی معاملات زوجی با استفاده از روش یادگیری تقویتی، با به‌کارگیری دیتاهای درون‎روزی در بورس اوراق بهادار تهران

ژورنال: تحقیقات مالی 2019

حسن حکیمیان, سعید فلاح پور,

هدف: معاملات زوجی از معروف‎ترین و قدیمی‎ترین سیستم‎های معاملات الگوریتمی است که کارایی و سودآوری آن در بسیاری از پژوهش‎هایی که تاکنون در بازارهای مالی مختلف صورت گرفته است، اثبات و نشان داده شده است. مهم‎ترین اصل در معاملات زوجی، وجود روابط تعادلی بلندمدت یا همان خاصیت بازگشت به میانگین است. از طرفی در سال‎های اخیر تحقیقات شایان ‌توجهی روی معاملات الگوریتمی با استفاده از یادگیری ماشین صورت گرفت...

متن کامل

تنظیم بهینه کنترل فازی نوع دوم برای سیستمهای غیرخطی

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه شهید باهنر کرمان - دانشکده ریاضی و کامپیوتر 1388

محمدعلی محمدی, علی اکبر قره ویسی, ماشاالله ماشین چی,

افزایش روزافزون سیستمهای کنترل در بسیاری از کاربردها ، منجر به روشهای متنوع کنترلی شده است. استفاده از منطق و سیستمهای کنترل فازی به علّت توصیف تقریبی قابل قبول و قابل تجزیه و نیز تحلیل یک مدل و همچنین به فرمول در آوردن دانش و معرفت بشری ، توانسته است که در بین انواع سیستمهای کنترل جایگاه مناسبی پیدا کند. اگرچه سیستمهای فازی پدیده های غیر قطعی و نامشخصی را توصیف می کنند ، با این حال خود تئوری فا...

15 صفحه اول

کنترل بهینه توزیع شده بازی های گرافی دیفرانسیلی غیر خطی به صورت برخط با استفاده از یادگیری تقویتی

ژورنال: کنترل 2015

تاتاری, فرزانه, نقیبی سیستانی, محمد باقر,

این مقاله به معرفی بازی های گرافی دیفرانسیلی برای سیستم های چند عاملی غیر خطی زمان پیوسته می پردازد و یک روش بهینه توزیع شده برخط برای حل آنها پیشنهاد می کند. در بازی های گرافی دیفرانسیلی، دینامیک خطا و اندیس عملکرد هر بازیکن تنها بستگی به اطلاعات همسایگان محلی آن عامل دارد. الگوریتم تکرار سیاست توزیع شده پیشنهاد شده، حل تقریبی معادلات همیلتون-جاکوبی کوپل شده همکارانه متعلق به عامل های غیر خطی...

متن کامل

بررسی اثر تقسیم پاداش بر روی یادگیری در یک تیم چند عامله گسترده

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه تهران 1380

محمدعلی عباسی, مجید نیلی احمدآبادی,

در یادگیری تیمی و هنگامی که مجموعه ای از عامل ها در کنار یکدیگر به یادگیری می پردازند، زمانی می توان یادگیری مناسبی داشت که در آن میزان کارایی هر عامل مشخص باشد و بتوان نقش عاملهای مختلف را به دستی در تیم تعییین کرد. در این صورت می توان براساس نقش و میزان تاثیرگذاری عامل در کار گروهی تیم به وی امتیاز داد. در تحقیقاتی که تاکنون انجام شده است نقش همه عاملهای شرکت کننده در یادگیری را یکسان فرض کرد...

15 صفحه اول

استفاده از روش یادگیری رقابتی برای قیمت دهی استراتژیک شرکت های تولید بر اساس lmp در بازار برق

ژورنال: :مهندسی برق دانشگاه تبریز 0

مریم رمضانیان لنگرودی دانشگاه آزاد اسلامی - واحد لاهیجان - گروه مهندسی برق سیدمازیار میرحسینی مقدم دانشگاه آزاد اسلامی - واحد لاهیجان - گروه مهندسی برق بهنام علیزاده دانشگاه آزاد اسلامی - واحد لاهیجان - گروه مهندسی برق

ساختار رقابت مابین تأمین کنندگان انرژی در بخش تولید بازارهای برق منجر به آن شده است که شرکت های تولید با اتخاذ تصمیمات استراتژیک به دنبال حداکثرسازی سودشان باشند. در این راستا، شرکت های تولید سعی می کنند که از طریق ارائه قیمتی مناسب در سطحی بالاتر از هزینه های حدی خود، در رقابت با سایر تولیدکنندگان سهم بیش تری از تأمین انرژی الکتریکی بازار برق را کسب نمایند. هدف این مقاله پیشنهاد یک روش مبتنی ب...

متن کامل