نتایج جستجو برای: یادگیری تقویتی چندعامله

تعداد نتایج: 20147  

در این مقاله با ترکیب ایده‌هایی از یادگیری تقویتی گرادیان سیاست و روش ازدحام ذرات یک روش ترکیبی بهینه‌سازی برای کنترل یک سیستم پیچیده غیرخطی ارائه‌شده است که کاربردهای فراوانی در جهان واقعی خواهد داشت. این سیستم ترکیبی بر روی یک پرنده هدایت پذیر از دور چهارروتور نصب‌شده است که باهدف کنترل جهت‌گیری و موقعیت پهپاد عمل می‌کند. در این روش با گرفتن ایده از روش‌های تقویتی، گرادیان سیاست در کنترل‌کنند...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه تبریز - دانشکده مهندسی فناوریهای نوین 1394

در دهه اخیر هوشمندسازی ربات ها مورد توجه بسیاری از پژوهشگران در زمینه مهندسی رباتیک و هوش مصنوعی قرار گرفته است. از چالش های پیشروی پژوهشگران در این زمینه ساخت ربات هایی است که دارای قابلیت یادگیری و تطبیق پذیری باشند. هدف از این پایان نامه استفاده از روش های یادگیری تقویتی برای طراحی مسیر بهینه برای ربات ها می باشد. در این مطالعه روشی نو برای یادگیری مسیر بهینه حرکت ربات های بازو از طریق تعامل...

ژورنال: :مهندسی برق دانشگاه تبریز 0
مریم رمضانیان لنگرودی دانشگاه آزاد اسلامی - واحد لاهیجان - گروه مهندسی برق سیدمازیار میرحسینی مقدم دانشگاه آزاد اسلامی - واحد لاهیجان - گروه مهندسی برق بهنام علیزاده دانشگاه آزاد اسلامی - واحد لاهیجان - گروه مهندسی برق

ساختار رقابت مابین تأمین کنندگان انرژی در بخش تولید بازارهای برق منجر به آن شده است که شرکت های تولید با اتخاذ تصمیمات استراتژیک به دنبال حداکثرسازی سودشان باشند. در این راستا، شرکت های تولید سعی می کنند که از طریق ارائه قیمتی مناسب در سطحی بالاتر از هزینه های حدی خود، در رقابت با سایر تولیدکنندگان سهم بیش تری از تأمین انرژی الکتریکی بازار برق را کسب نمایند. هدف این مقاله پیشنهاد یک روش مبتنی ب...

ساختار رقابت مابین تأمین‌کنندگان انرژی در بخش تولید بازارهای برق منجر به آن شده است که شرکت‌های تولید با اتخاذ تصمیمات استراتژیک به‌دنبال حداکثرسازی سودشان باشند. در این راستا، شرکت‌های تولید سعی می‌کنند که از طریق ارائه قیمتی مناسب در سطحی بالاتر از هزینه‌های حدی خود، در رقابت با سایر تولیدکنندگان سهم بیش‌تری از تأمین انرژی الکتریکی بازار برق را کسب نمایند. هدف این مقاله پیشنهاد یک روش مبتنی ب...

احمدرضا پاکرائی

پیشرفت‌ها در حوزۀ هوش مصنوعی و یادگیری ماشین به‌خصوص درزمینۀ محاسبات تکاملی نه‌تنها ما را قادر به تجزیه‌وتحلیل مؤثرتر داده‌ها نموده است، بلکه این امکان را فراهم ساخته که از آن‌ها برای فهم هرگونه الگوی زیربنایی بازارهای مالی استفاده گردد. اقتصاددانان، آماردانان و مدرسان امور مالی همواره علاقه‌مند به توسعه و آزمایش مدل‌های رفتاری قیمت سهام بوده‌اند. XCS سامانه‌ای مرکب از الگوریتم ژنتیک و یادگیری ...

ژورنال: :مجله دیابت و متابولیسم ایران 0
حسین فرضعلی وند hossein farzalivand khozestan, izeh, zagros street, izeh branch, islamic azad university, young researchers club phone: 09384221895خوزستان، ایذه، خیابان زاگرس، میدان دانشجو، دانشگاه آزاد اسلامی واحد ایذه، باشگاه پژوهشگران و نخبگان تلفن: 09384221895

مقدمه: یکی از عوارض خطرناک بیماری دیابت نوع یک افزایش و کاهش ناگهانی سطح غلظت قند خون می باشد که باعث بروز خطراتی چون اغماء و بیهوشی خواهد شد. بنابراین استفاده از روش هایی با درصد خطای پایین و هوشمند با اطلاعات موجود در جهت پیش بینی و در نهایت پیشگیری از این عوارض،گام مهمی در جهت کنترل بهینه بیماری محسوب می شود. به همین منظور در این مقاله ما از الگوریتم ترکیبی fuzzy sarsa برای طراحی سیستم خبره ...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه شهید چمران اهواز - دانشکده مهندسی 1394

مسئله ی فوتبال ربات ها یکی از سیستم های چندعاملی پیچیده است، از آن جایی که هدف اصلی مسابقه ی فوتبال گل زدن است برای یک عامل فوتبال ربات ها مهم است که یک تکنیک در مورد چگونگی به ثمر رساندن یک گل، داشته باشند. در این پایان نامه از الگوریتم بهینه سازی ازدحام ذرات مبتنی بر یادگیری تقویتی برای پیدا کردن بهترین مکان از دروازه برای شوت کردن توپ به سمت آن، استفاده شده است. تابع ارزیابی برای الگوریتم از...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه شهید چمران اهواز - دانشکده مهندسی 1393

یادگیری از مهم ترین مسائل مطرح در سیستم های چندپیشکاره است. این سیستم ها شامل چندین پیشکار هستند که با یکدیگر تعامل دارند. در چنین سیستم هایی رفتار پیشکار ها قابل پیش بینی نیست، بنابراین لازم است که پیشکارها از محیط اطرافشان بیاموزند و خود را با آن سازگار کنند. پیشکارها برای یادگیری، نیازمند مدل ها و الگوریتم های یادگیری هستند. در این پایان نامه مدل یادگیری مبتنی بر مشاهده، که با نام یادگیری تق...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه تحصیلات تکمیلی علوم پایه زنجان - دانشکده ریاضی 1389

یادگیری مفاهیم یکی از مباحث مهم در سیستمهای چند عامله است. تمرکز این مبحث بروی عامل هایی است که با استفاده از استقلال خود برای رشد و پیشرفت در محیط پیرامون خود، از دانش یکدیگر برای تعالی دانش خود نسبت به محیط استفاده می کنند. بدین منظور یک عامل با دریافت اطلاعات جدید از محیط و یا دیگر عامل ها می باید قادر باشد تا دانش خود را از جهان پیرامون خود بروز رسانی کند. پس به عنوان بخشی از جهان بینی و ی...

در نیمه دوم قرن گذشته اغلب جوامع شاهد شروع پدیده ای بنام ترافیک شهری در خود بوده اند که علت رخداد چنین پدیده ای عبور تعداد زیادی خودرو در زمان یکسان از یک زیر ساخت حمل و نقلی یکسان می باشد. پدیده ترافیک شهری دارای پیامدهای اقتصادی و محیط زیستی کاملاً شناخته شده ای از جمله آلودگی هوا، کاهش در سرعت، افزایش زمان سفر، افزایش مصرف سوخت و حتی افزایش تصادفات می باشد. یکی از راه های اقتصادی برای مدیریت ...

نمودار تعداد نتایج جستجو در هر سال

با کلیک روی نمودار نتایج را به سال انتشار فیلتر کنید