یادگیری تقویتی چندعامله

بررسی فرآیند تقسیم امتیاز بین اعضای یک گروه از عاملهای همکار

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه تهران 1382

احد هراتی, مجید نیلی احمدآبادی,

یادگیری چند عامله ، فصل مشترک مبحث نسبتا قدیمی یادگیری ماشین و رویکرد جدید چندعامله در هوش مصنوعی است. با مطرح شدن این موضوع در بسترهای تحقیقاتی سیستم های هوشمند، مسائل جدیدی شکل گرفتند که تا پیش از آن مورد مطالعه واقع نشده بودند. از جمله چنین مسائلی فرایند تقسیم امتیاز در تیمی از عاملهای یادگیر تقویتی است.دراین پژوهش ایده تقسیم امتیاز مبتنی بر دانش مطرح شده ، در قالب شبیه سازی یک سیستم نمونه و...

15 صفحه اول

راهکارکنترل مقاوم مبتنی بر یادگیری تقویتی به منظور توانبخشی حرکتی بازوی دست

ژورنال: :کنترل 0

زهرا حسن زاده بنابیدی zahra hasanzadeh binabidi گروه مهندسی پزشکی، دانشگاه آزاد اسلامی، واحد مشهد حمیدرضا کبروی hamidreza kobravi گروه مهندسی پزشکی، دانشگاه آزاد اسلامی، واحد مشهد سعید طوسی زاده saeed toosizadeh گروه مهندسی برق، دانشگاه آزاد اسلامی، واحد مشهد رضا بوستانی reza boostani گروه مغز و اعصاب، دانشگاه علوم پزشکی مشهد

توانبخشی حرکتی از مباحث مورد توجه محققان است. در اینتحقیق، یک راهکار کنترلی به منظور کنترل حرکت مدلی از بازوی دست با سه مفصل ارائه شده است. در مدل مورد استفاده، اثر فعالسازی همزمان عضلات آگونیست و آنتاگونیست مفصل مچ دست با استفاده از مکانیزم فریز سازی لحاظ شده است. با الهام از عملکرد سیستم اعصاب مرکزی در کسب مهارتهای حرکتی، راهکار کنترلی ارئه شده مبتنی بر یکی از الگوریتم های یادگیری تقویتی توسع...

متن کامل

اکتساب مهارت در یادگیری تقویتی با استفاده از مدل های آماری خوشه بندی گراف

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه کردستان - دانشکده فنی 1391

ابراهیم حبیبی, پرهام مرادی, فردین اخلاقیان طاب,

یادگیری تقویتی با مسئله یادگیری عامل هوشمند برای انتخاب اعمال به منظور بیشینه کردن کارایی عامل سروکار دارد. استفاده از مهارت ها در یادگیری تقویتی، سبب سرعت بخشیدن به کارکرد عامل می شود. یافتن اهداف میانی و ایجاد مهارت برای دست یابی به آنها، مسئله ای کلیدی در کشف خودکار مهارت می باشد. با کشف اهداف میانی و تعیین تابع سیاست دست یابی به آنها، عامل قادر به اکتشاف موثرتر ویادگیری سریع تر در کارهای دی...

15 صفحه اول

یک پروتکل mac آگاه از کیفیت تجربه کاربر مبتنی بر استاندارد ieee ۸۰۲.۱۱e

ژورنال: :مهندسی برق دانشگاه تبریز 0

محمد حامدیان دانشگاه اصفهان - دانشکده مهندسی کامپیوتر بهروز شاهقلی قهفرخی دانشگاه اصفهان - دانشکده مهندسی کامپیوتر ندا مقیم دانشگاه اصفهان - دانشکده مهندسی کامپیوتر

با توسعه استاندارد ieee 802.11 که منجر به تبیین استاندارد ieee 802.11e گردید؛ قابلیت تأمین کیفیت خدمات در شبکه های بی سیم میسر شد؛ اما این استاندارد دارای اشکالات عمده ای از قبیل عدم توجه به کیفیت تجربه کاربر (qoe) در ترافیک بلادرنگ است که باعث شده تا از منابع رادیویی موجود به صورت بهینه استفاده نگردد. یکسان بودن پنجره رقابت و حداکثر فرصت ارسال فریم برای تمام کاربران یک کلاس سرویس به معنی عدم ت...

متن کامل

روش یادگیری q-فازی در ترکیب با روش های بهینه سازی برای کنترل فازی تقویتی

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه شهید باهنر کرمان - دانشکده مهندسی 1393

سیما سعید, علی اکبر نیک نفس, مهدی افتخاری,

طراحی کنترل کننده های فازی با استفاده از الگوریتم های تکاملی و یادگیری تقویتی q - فازی موضوعی است که در کنترل ربات ها نقش مهمی ایفا می کند. در این پایان نامه سه روش پیشنهادی برای حل مسائل کنترلی فازی تقویتی ارائه گردیده است و هر سه این روش ها روی یک مسئله فازی تقویتی به نام، ماشین عقب رونده به سمت بالا، شبیه سازی شده اند و همه ی این روش ها از ترکیب یادگیری q-فازی با یک الگوریتم بهینه سازی ایجاد...

15 صفحه اول

کنترل سطح ویروس ها در بیماران مبتلا به hiv با استفاده از یادگیری تقویتی

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1390

امین نوری, ناصر پریز, غزاله شجاع رضوی,

hiv ویروسی است که با مختل کردن عملکرد و از بین بردن نوع خاصی از سلول های ایمنی بدن به نام t-cd4 منجر به نقص دستگاه ایمنی بدن انسان می شود. این ویروس با از بین بردن این گونه از سلول ها، باعث ایجاد بیماری ایدز (نقص ایمنی اکتسابی) می شود. امروزه پیشرفت های قابل توجهی در داروهای مورد استفاده در درمان بیماران مبتلا به عفونت hiv پدیدار گشته است که سبب بهبود کیفیت زندگی و افزایش طول عمر بیماران شده اس...

15 صفحه اول

اکتساب مهارت در یادگیری تقویتی رباتیک توسط عاملهای خودمختار

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود - دانشکده کامپیوتر و فناوری اطلاعات 1393

فاطمه تلگردی, علی اکبر پویان, سعید شیری قیداری, علیرضا خلیلیان,

یادگیری تقویتی یکی از حوزه های یادگیری ماشین است که هدف آن بهبود رفتار عامل بر اساس سیگنال های تقویتی است که از محیط دریافت می کند. مشکل اینجاست که در بسیاری از کاربردهای واقعی، پاداش محیط با تاخیر بسیار زیادی به عامل داده می شود. مشکل دیگر این است که تا زمانی که عامل به یک سطح قابل قبول از یادگیری برسد، تمام حرکات آن تصادفی خواهد بود. ضمناً با پیچیده تر شدن محیط، تعداد وضعیت های مورد اکتشاف و پ...

حذف نویز صوتی تناوبی با روش فعال و هوشمند

ژورنال: :مکانیک سازه ها و شاره ها 2013

بهروز رئیسی شاپور گلبهار حقیقی علی اکبر صفوی

در این تحقیق، روشی جدید مبتنی بر تکنیکهای یادگیری تقویتی با تکیه بر روش تفاوت زمانی صفر در مبحث یادگیری تقویتی، برای حذف نویز صوتی به صورت فعال در سیگنالهای باند باریک ارائه گردیده است. برای پیاده سازی این روش مبتنی بر فیدبک، اطلاعاتی از دینامیک مسیر اولیه و ثانویه لازم نمی باشد و در نتیجه این روش نسبت به تغییر این پارامترها به صورت مقاوم عمل می نماید. حجم بسیار کم محاسبات ریاضی و حافظه بسیار ا...

متن کامل

کنترل کننده مقاوم تطبیقی بار فرکانس مبتنی بر یادگیری تقویتی برای یک سیستم قدرت به هم پیوسته شامل smes

ژورنال: :مهندسی برق دانشگاه تبریز 0

عادل اکبری مجد دانشگاه محقق اردبیلی - دانشکده فنی و مهندسی - گروه مهندسی برق حسین شایقی دانشگاه محقق اردبیلی - دانشکده فنی و مهندسی - گروه مهندسی برق حمید محمدنژاد دانشگاه محقق اردبیلی - دانشکده فنی و مهندسی - گروه مهندسی برق عبداله یونسی دانشگاه محقق اردبیلی - دانشکده فنی و مهندسی - گروه مهندسی برق

هدف از این مقاله استفاده از یادگیری تقویتی برای طراحی کنترل کننده های pid و smes مقاوم و تطبیقی برای کنترل بار فرکانسی در یک سیستم قدرت دو ناحیه ای حرارتی است. ابتدا تنظیم پارامترهای کنترل کننده های pid و smes به صورت یک مسئله بهینه سازی مدل شده توسط الگوریتم تدریس - یادگیری اصلاح شده حل می شود. سپس عملکرد هم زمان آن ها با استفاده از الگوریتم پیشنهادی مبتنی بر یادگیری تقویتی بهینه می گردد. کنتر...

متن کامل

ساختارعصبی تقریب تابع مبتنی بر dignet برای یادگیری تقویتی

پایان نامه :دانشگاه تربیت معلم - تهران - دانشکده فنی 1391

نجمه علی بابایی, میرمحسن پدرام,

یادگیری تقویتی عبارت است از قالب بندی یک مسئله به فرم یادگیری از طریق تعامل برای رسیدن به هدف. زمانی که فضای حالات و یا کنش ها پیوسته و یا خیلی بزرگ شود استفاده از عناصر حافظه برای نگه داری ارزش حالات بسیار زیاد خواهد شد. این مسئله در رابطه با زمانی که در طول یادگیری ارزش کنش ها به دست آورده می شود، بحرانی تر خواهد شد. علاوه بر حافظه مصرفی مسئله ، داده و زمان لازم برای پر کردن آنها نیز مهم است....

15 صفحه اول