یادگیری تقویتی

نتایج جستجو برای: یادگیری تقویتی

تعداد نتایج: 20110 فیلتر نتایج به سال:

بررسی فرآیند تقسیم امتیاز بین اعضای یک گروه از عاملهای همکار

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه تهران 1382

یادگیری چند عامله ، فصل مشترک مبحث نسبتا قدیمی یادگیری ماشین و رویکرد جدید چندعامله در هوش مصنوعی است. با مطرح شدن این موضوع در بسترهای تحقیقاتی سیستم های هوشمند، مسائل جدیدی شکل گرفتند که تا پیش از آن مورد مطالعه واقع نشده بودند. از جمله چنین مسائلی فرایند تقسیم امتیاز در تیمی از عاملهای یادگیر تقویتی است.دراین پژوهش ایده تقسیم امتیاز مبتنی بر دانش مطرح شده ، در قالب شبیه سازی یک سیستم نمونه و...

15 صفحه اول

به کارگیری روش های یادگیری تقویتی و کاهش ابعاد داده درحذف نویز به صورت فعال

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده مهندسی برق و کامپیوتر 1392

بهروز رییسی, علی اکبر صفوی, شاپور گلبهار حقیقی, [email protected] یزدی,

آلودگی صوتی یکی از معضلات جدی جوامع صنعتی می باشد. هر چند روش های متکی بر جذب صوت کاربردهای فراوانی داشته اما در فرکانس های پایین کارایی لازم را ندارند. برای غلبه بر این مشکل رویه های فعال برای حذف نویز ارائه گردیده اند. در این تحقیق نیز به منظور کاهش نویز صوتی به صورت فعال، ایده هایی مبتنی بر یادگیری تقویتی ارائه گردید. در این مسیر ابتدا برای سیگنال های تناوبی یک روش پیشنهاد شد که در آن نیازی ...

15 صفحه اول

تولید قواعد فازی احتمالی به‌کمک یادگیری تقویتی

ژورنال: مهندسی برق دانشگاه تبریز 2018

نعیمه محمدکریمی, ولی درهمی,

مهم‌ترین بخش در یک سیستم فازی پایگاه قواعد آن است. یکی از مشکلات موجود در تولید قواعد فازی با داده‌های آموزشی، وجود داده‌های ناسازگار است زیرا در این‌گونه داده‌ها چند خروجی برای وضعیت‌های یکسان وجود دارد. لذا تولید قواعد و تصمیم‌گیری برای انتخاب تالی مناسب برای هر قاعده با چالش همراه خواهد بود. روش‌های موجود از برآیند حالت‌های ناسازگار استفاده می‌کنند که باعث تولید خروجی با مقدار میانگین تالی‌ه...

متن کامل

یک روش ترکیبی جدید یادگیری تقویتی فازی

ژورنال: کنترل 2014

درهمی, ولی, قربانی, فرزانه , نظام آبادی پور, حسین,

در این مقاله یک روش جدید یادگیری تقویتی پیوسته برای مسائل کنترل ارائه می‌شود. روش ارائه شده از ترکیب روش "تکرار سیاست کمترین مربعات " با یک سیستم فازی سوگنوی مرتبه صفر حاصل شده و "تکرار سیاست کمترین مربعات فازی" نامیده شده است. در اینجا برای هر قاعده فازی تعدادی عمل نامزد در نظر گرفته می‌شود. هدف، یافتن مناسب‌ترین عمل نامزد (تالی) برای هر قاعده می‌باشد. با استفاده از بردار شدت آتش قواعد فازی و ...

متن کامل

به کارگیری روش یادگیری تقویتی برای مسیریابی پویا در شبکه به عنوان یک سیستم چند عاملی

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی اصفهان - دانشکده برق و کامپیوتر 1386

سعید مجیدی, مسعودرضا هاشمی, مازیار پالهنگ,

شبکه های کامپیوتری نمونه مهمی از سیستم های پویای توزیع شده هستند که در زندگی روزانه نقش زیادی پیدا نموده اند. اهمیت استراتژیک و محدودیت های ذاتی این گونه سیستم ها منجر به نیاز به کنترل توزیع شده، به خصوص برای مسیریابی، می شود تا رفتار شبکه را قابل تطبیق با تغییرات در توپولوژی، ترافیک داده ها، سرویس ها و غیره نماید. اخیراً، محققین بر روی الگوریتم های مسیر یابی جدیدتری به منظور فراهم آوردن میزان ا...

15 صفحه اول

تقریب تابع ارزش عمل با استفاده از شبکه توابع پایه شعاعی برای یادگیری تقویتی

ژورنال: کنترل 2011

درهمی, ولی, محرابی, امید,

مشکل تنگنای ابعاد، یکی از چالش هایی است که کاربرد الگوریتم های یادگیری تقویتی گسسته را در مورد مسائل کنترلی واقعی که دارای فضای حالت و عمل بزرگ و یا پیوسته می باشند محدود نموده است. ترکیب روش های آموزشی گسسته با تقریب زننده های تابعی برای حل این مشکل چندی است مورد توجه محققان قرارگرفته است. در همین راستا در این مقاله یک الگوریتم جدید یادگیری تقویتی عصبی (NRL) بر مبنای معماری نقاد- تنها معرف...

متن کامل

تحلیل و شبیه سازی مسیریابی بهینه ربات ها بر پایه الگوریتم های یادگیری تقویتی چند هدفه

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی خواجه نصیرالدین طوسی 1389

الهام کشت گر, محمد تشنه لب,

در این پایان نامه مسأله مسیریابی بهینه رباتها را در محیط هایی با چند هدف در تناقض باهم با استفاده از الگوریتم های یادگیری تقویتی چندهدفه مورد تحلیل و بررسی قرار می گیرد. اخیرا تحقیقات گسترده ای در زمینه بهینه سازی چندهدفه توسط محققین انجام شده است، نه تنها به علت ماهیت چندهدفه بودن اکثر مسائل دنیای واقعی، بلکه به علت اینکه هنوز بسیاری از سوال های بی جواب در این زمینه وجود دارد. به همین دلایل در...

15 صفحه اول

طراحی عامل تجارتگر با استفاده از تکنیک مذاکره ی تئوری بازی همراه با یادگیری تقویتی

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی کامپیوتر 1384

علی حسینی پارسا, محمدرضا رزازی,

با توجه به محدودیت های کاربردهای تجارت الکترونیکی سنتی، نیاز به نسل جدیدی از این کاربردها احساس می شود که با عنوان تجارت الکترونیکی با عامل واسط مطرح می شود. تغییرات عمده ای که تجارت الکترونیکی با عامل واسط ایجاد می کند این است که قیمت گذاری پویا و شخصی سازی پیشنهادها برای بسیاری از کالاها و مشتریان و فروشندگان معمول می گردد. عامل ها در این گونه از تجارت الکترونیکی در پنج مرحله می توانند نقش ...

15 صفحه اول

ارائه یک روش جدید یادگیری تقویتی پیوسته با تاکید بر تحلیل ریاضی

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده برق و کامپیوتر 1392

فرزانه قربانی, ولی درهمی, حسین نظام آبادی پور,

یکی از چالش های یادگیری تقویتی، عدم وجود الگوریتم های قابل اجرا در فضای حالت و عمل پیوسته است که دارای استدلال ریاضی باشند. در این پایان نامه سعی داریم با ارائه یک روش جدید یادگیری تقویتی پیوسته مبتنی بر معماری نقاد-تنها برای مسائل کنترل این چالش ها را برطرف کنیم. روش ارائه شده از ترکیب روش "تکرار سیاست کمترین مربعات" با یک سیستم فازی سوگنوی مرتبه صفر حاصل شده و "تکرار سیاست کمترین مربعات فازی"...

15 صفحه اول

انتخاب ویژگی با استفاده از الگوریتم های ممتیک و یادگیری تقویتی

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه شهید باهنر کرمان - دانشکده فنی 1393

احسان اسلامی, مهدی افتخاری, حمید میروزیری,

انتخاب ویژگی تمرکز بسیاری از حوزه¬های تحقیقاتی در سال¬های اخیر را به خود جلب کرده است. با پیشرفت سریع فنّاوری کامپیوتری، پایگاه¬ داده¬هایی با صدها و هزاران ویژگی در شناسایی الگو، داده کاوی، یادگیری ماشین و… به وجود آمده است. به¬طوری¬که پردازش مجموعه داده¬های بزرگ، یک کار چالش برانگیز شده است. انتخاب ویژگی این مشکل را با از بین بردن داده¬های بی¬ربط، زائد یا نویزی حل می¬کند. این عمل کارایی الگوریت...

15 صفحه اول

نمودار تعداد نتایج جستجو در هر سال

با کلیک روی نمودار نتایج را به سال انتشار فیلتر کنید