نتایج جستجو برای: یادگیری تقویتی
تعداد نتایج: 20110 فیلتر نتایج به سال:
یادگیری چند عامله ، فصل مشترک مبحث نسبتا قدیمی یادگیری ماشین و رویکرد جدید چندعامله در هوش مصنوعی است. با مطرح شدن این موضوع در بسترهای تحقیقاتی سیستم های هوشمند، مسائل جدیدی شکل گرفتند که تا پیش از آن مورد مطالعه واقع نشده بودند. از جمله چنین مسائلی فرایند تقسیم امتیاز در تیمی از عاملهای یادگیر تقویتی است.دراین پژوهش ایده تقسیم امتیاز مبتنی بر دانش مطرح شده ، در قالب شبیه سازی یک سیستم نمونه و...
آلودگی صوتی یکی از معضلات جدی جوامع صنعتی می باشد. هر چند روش های متکی بر جذب صوت کاربردهای فراوانی داشته اما در فرکانس های پایین کارایی لازم را ندارند. برای غلبه بر این مشکل رویه های فعال برای حذف نویز ارائه گردیده اند. در این تحقیق نیز به منظور کاهش نویز صوتی به صورت فعال، ایده هایی مبتنی بر یادگیری تقویتی ارائه گردید. در این مسیر ابتدا برای سیگنال های تناوبی یک روش پیشنهاد شد که در آن نیازی ...
مهمترین بخش در یک سیستم فازی پایگاه قواعد آن است. یکی از مشکلات موجود در تولید قواعد فازی با دادههای آموزشی، وجود دادههای ناسازگار است زیرا در اینگونه دادهها چند خروجی برای وضعیتهای یکسان وجود دارد. لذا تولید قواعد و تصمیمگیری برای انتخاب تالی مناسب برای هر قاعده با چالش همراه خواهد بود. روشهای موجود از برآیند حالتهای ناسازگار استفاده میکنند که باعث تولید خروجی با مقدار میانگین تالیه...
در این مقاله یک روش جدید یادگیری تقویتی پیوسته برای مسائل کنترل ارائه میشود. روش ارائه شده از ترکیب روش "تکرار سیاست کمترین مربعات " با یک سیستم فازی سوگنوی مرتبه صفر حاصل شده و "تکرار سیاست کمترین مربعات فازی" نامیده شده است. در اینجا برای هر قاعده فازی تعدادی عمل نامزد در نظر گرفته میشود. هدف، یافتن مناسبترین عمل نامزد (تالی) برای هر قاعده میباشد. با استفاده از بردار شدت آتش قواعد فازی و ...
شبکه های کامپیوتری نمونه مهمی از سیستم های پویای توزیع شده هستند که در زندگی روزانه نقش زیادی پیدا نموده اند. اهمیت استراتژیک و محدودیت های ذاتی این گونه سیستم ها منجر به نیاز به کنترل توزیع شده، به خصوص برای مسیریابی، می شود تا رفتار شبکه را قابل تطبیق با تغییرات در توپولوژی، ترافیک داده ها، سرویس ها و غیره نماید. اخیراً، محققین بر روی الگوریتم های مسیر یابی جدیدتری به منظور فراهم آوردن میزان ا...
مشکل تنگنای ابعاد، یکی از چالش هایی است که کاربرد الگوریتم های یادگیری تقویتی گسسته را در مورد مسائل کنترلی واقعی که دارای فضای حالت و عمل بزرگ و یا پیوسته می باشند محدود نموده است. ترکیب روش های آموزشی گسسته با تقریب زننده های تابعی برای حل این مشکل چندی است مورد توجه محققان قرارگرفته است. در همین راستا در این مقاله یک الگوریتم جدید یادگیری تقویتی عصبی (NRL) بر مبنای معماری نقاد- تنها معرف...
در این پایان نامه مسأله مسیریابی بهینه رباتها را در محیط هایی با چند هدف در تناقض باهم با استفاده از الگوریتم های یادگیری تقویتی چندهدفه مورد تحلیل و بررسی قرار می گیرد. اخیرا تحقیقات گسترده ای در زمینه بهینه سازی چندهدفه توسط محققین انجام شده است، نه تنها به علت ماهیت چندهدفه بودن اکثر مسائل دنیای واقعی، بلکه به علت اینکه هنوز بسیاری از سوال های بی جواب در این زمینه وجود دارد. به همین دلایل در...
با توجه به محدودیت های کاربردهای تجارت الکترونیکی سنتی، نیاز به نسل جدیدی از این کاربردها احساس می شود که با عنوان تجارت الکترونیکی با عامل واسط مطرح می شود. تغییرات عمده ای که تجارت الکترونیکی با عامل واسط ایجاد می کند این است که قیمت گذاری پویا و شخصی سازی پیشنهادها برای بسیاری از کالاها و مشتریان و فروشندگان معمول می گردد. عامل ها در این گونه از تجارت الکترونیکی در پنج مرحله می توانند نقش ...
یکی از چالش های یادگیری تقویتی، عدم وجود الگوریتم های قابل اجرا در فضای حالت و عمل پیوسته است که دارای استدلال ریاضی باشند. در این پایان نامه سعی داریم با ارائه یک روش جدید یادگیری تقویتی پیوسته مبتنی بر معماری نقاد-تنها برای مسائل کنترل این چالش ها را برطرف کنیم. روش ارائه شده از ترکیب روش "تکرار سیاست کمترین مربعات" با یک سیستم فازی سوگنوی مرتبه صفر حاصل شده و "تکرار سیاست کمترین مربعات فازی"...
انتخاب ویژگی تمرکز بسیاری از حوزه¬های تحقیقاتی در سال¬های اخیر را به خود جلب کرده است. با پیشرفت سریع فنّاوری کامپیوتری، پایگاه¬ داده¬هایی با صدها و هزاران ویژگی در شناسایی الگو، داده کاوی، یادگیری ماشین و… به وجود آمده است. به¬طوری¬که پردازش مجموعه داده¬های بزرگ، یک کار چالش برانگیز شده است. انتخاب ویژگی این مشکل را با از بین بردن داده¬های بی¬ربط، زائد یا نویزی حل می¬کند. این عمل کارایی الگوریت...
نمودار تعداد نتایج جستجو در هر سال
با کلیک روی نمودار نتایج را به سال انتشار فیلتر کنید