نام پژوهشگر: غزاله محسنی راد

پیشنهاد استراتژی قیمت دهی فروشندگان انرژی بازار برق با کمک الگوریتم های یادگیری تقویتی مبتنی بر تبرید تدریجی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1393
  غزاله محسنی راد   محمد باقر نقیبی سیستانی

در این پایان نامه مسئله استراتژی قیمت¬دهی تولیدکنندگان انرژی در بازار یکنواخت برق برای رسیدن به حداکثر سود بررسی شده است. فروشندگان انرژی پیشنهادات قیمت خود را با بهره گیری از سه الگوریتم متفاوت q-learning، r-learning و sarsa برای یک ساعت مشخص از شبانه روز به اپراتور سیستم اعلام می کنند. الگوریتم های یادگیری تقویتی ذکر شده با روش انتخاب عمل تبرید تدریجی، ترکیب شده اند. سود بدست آمده برای فروشندگان از دو دیدگاه دست یابی به بیشترین سود برای هر فروشنده و توزیع عادلانه سود بین همه فروشندگان، مورد مقایسه قرار گرفته است. همچنین تاثیر تغییر پارامترهای الگوریتم sa-r بر نحوه توزیع سود بین شرکت کنندگان بازار، بررسی شده است. سه معیار برای تشخیص توزیع عادلانه سود بین فروشندگان معرفی شده و بر اساس این معیارها، به ترتیب الگوریتم های sa-r، sa-sarsa و sa-q عادلانه ترین توزیع سود را برای فروشندگان به ارمغان می آورند. وضعیت تولید¬کنندگان، از نظر توان رقابت در بازار با هم مقایسه شده و به سه دسته دارای قدرت بازار، وضعیت مطلوب و وضعیت نا¬مطلوب تقسیم شده اند. برای فروشندگان با وضعیت مطلوب و قدرت بازار، به ترتیب الگوریتم های sa-q ، sa-sarsa و sa-r و برای فروشندگان با وضعیت نا¬مطلوب به ترتیب الگوریتم های sa-sarsa، sa-r و sa-q بیشترین سود را در پی دارند. بررسی تاثیر تغییر پارامترهای الگوریتم sa-r نشان داد، انتخاب مقادیر بزرگتر از 0.4 برای نرخ یادگیری و مقادیر بزرگتر از 0.1 برای نرخ یادگیری متوسط پاداش، به کنترل بیشتر قدرت بازار و توزیع عادلانه تری در سود می انجامد.