ارائه روشی نوین مبتنی بر یادگیری تقویتی برای تعیین ساختار در شناسایی سیستم ها

پایان نامه
چکیده

ساختارها و مدل های دارای دینامیک متغیر و نحوه تعیین ساختار آنها به خصوص در حالت برخط طی سال های اخیر به منظور توسعه و بهبود روش های شناسایی سیستم ها مورد توجه قرار گرفته اند. در این پایان نامه روشی نوین مبتنی بر الگوریتم های انتخاب عمل و پاداش دهی در یادگیری تقویتی برای تعیین ساختار در شناسایی سیستم ها ارائه شده است. قابلیت تعیین ساختار به صورت افزایشی یکی از ویژگی های بارز الگوریتم ارائه شده است که می تواند به منظور تشخیص تغییر دینامیک در سیستم های هایبرید بسیار موثر باشد. از آنجا که تا به حال روش های یادگیری تقویتی مستقیما برای تشخیص ساختار به کار گرفته نشده اند و صرفا به منظور تنظیم پارامترهای شبکه مورد استفاده قرار گرفته اند، استفاده از این روش ها در تعیین ساختار جنبه نوآوری الگوریتم ارائه شده محسوب می شود. در این پایان نامه جزئیات الگوریتم، مزایا و معایب آن در مقایسه با سایر روش ها و کارایی آن طی مثال های متعدد مورد بررسی قرار گرفته است.

منابع مشابه

روشی نوین برای یادگیری تقویتی فازیِ باناظر برای ناوبری ربات

: استفاده از یادگیری باناظر در ناوبری ربات های متحرک، با چالش های جدی از قبیل ناسازگاری و اختلال در داده ها، مشکل جمع آوری نمودن داده آموزش و خطای زیاد در داده های آموزشی مواجه می باشد. قابلیت های یادگیری تقویتی همچون عدم نیاز به داده آموزشی و آموزش تنها با استفاده از یک معیار اسکالر راندمان باعث کاربرد آن در ناوبری ربات شده است. از طرفی یادگیری تقویتی زمانبر بوده و دارای نرخ شکست های بالا در م...

متن کامل

روشی نوین برای یادگیری تقویتی فازیِ باناظر برای ناوبری ربات

: استفاده از یادگیری باناظر در ناوبری ربات های متحرک، با چالش های جدی از قبیل ناسازگاری و اختلال در داده ها، مشکل جمع آوری نمودن داده آموزش و خطای زیاد در داده های آموزشی مواجه می باشد. قابلیت های یادگیری تقویتی همچون عدم نیاز به داده آموزشی و آموزش تنها با استفاده از یک معیار اسکالر راندمان باعث کاربرد آن در ناوبری ربات شده است. از طرفی یادگیری تقویتی زمانبر بوده و دارای نرخ شکست های بالا در م...

متن کامل

کنترل‌کننده مقاوم تطبیقی بار فرکانس مبتنی بر یادگیری تقویتی برای یک سیستم قدرت به‌هم‌پیوسته شامل SMES

هدف از این مقاله استفاده از یادگیری تقویتی برای طراحی کنترل‌کننده‌های PID و SMES مقاوم و تطبیقی برای کنترل بار فرکانسی در یک سیستم قدرت دو ناحیه‌ای حرارتی است. ابتدا تنظیم پارامترهای کنترل‌کننده‌های PID و SMES به‌صورت یک مسئله بهینه‌سازی مدل‌شده توسط الگوریتم تدریس - یادگیری اصلاح‌شده حل می‌شود. سپس عملکرد هم‌زمان آن‌ها با استفاده از الگوریتم پیشنهادی مبتنی بر یادگیری تقویتی بهینه می‌گردد. کنتر...

متن کامل

ارائه روشی نوین برای بهره برداری و تشخیص حالت جزیره ای تولیدات پراکنده مبتنی بر اینورتر

This article is introducing a new controlling scheme for islanding operating of inverter-based distributed generations. That in this method load protection at the time of connection to the network and islanding operation is completely intended. Moreover, the islanding detection algorithm which is based on ROCOF relaying, for detecting islanding phenomenon is provided. The algorithm is also equi...

متن کامل

ارائه روشی مبتنی بر هوش مصنوعی و سیستم اطلاعات مکانی به منظور تعیین مکان بهینه

هدف یک مسأله تعیین مکان بهینه، انتخاب مکانی با کاربرد خاص و با در نظر گرفتن معیارهای متعدد می‌باشد. عموماً مسائل تعیین مکان بهینه دارای ساختاری پیچیده می‌باشد. از جمله مسائل مهم شهری تعیین مکان بهینه ایستگاه‌های آتش‌نشانی است که به دلیل نجات و محافظت از جان و مال انسان‌ها دارای اهمیت فراوانی می‌باشد. در این تحقیق با در نظر گرفتن سیزده پارامتر مؤثر بر تعیین مکان بهینه ایستگاه‌های آتش‌نشانی، سعی...

متن کامل

ارائه روشی مبتنی بر یادگیری تقویتی به منظور رهیابی ربات متحرک در محیط نیمه ساختار یافته درون ساختمان

رهیابی یا ناوبری ربات عبارت است از حرکت ربات در محیط و رسیدن به هدف مطلوب بدون آنکه به موانع برخورد کند، رهیابی ربات درون محیط ساختمان از دو جنبه مورد اهمیت است. از طرفی محیط ساختمان نیمه ساختار یافته است، یعنی اندازه و مکان بعضی از موانع شناخته شده نیستند و از طرف دیگر موانع و هدف نیز می توانند متحرک باشند؛ لذا استفاده از سنسورهایی که ربات بتواند شناخت محلی از اطراف ربات به دست بیاورد امری اجت...

15 صفحه اول

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023