نتایج جستجو برای: یادگیری تقویتی

تعداد نتایج: 20110  

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه تهران 1382

یادگیری چند عامله ، فصل مشترک مبحث نسبتا قدیمی یادگیری ماشین و رویکرد جدید چندعامله در هوش مصنوعی است. با مطرح شدن این موضوع در بسترهای تحقیقاتی سیستم های هوشمند، مسائل جدیدی شکل گرفتند که تا پیش از آن مورد مطالعه واقع نشده بودند. از جمله چنین مسائلی فرایند تقسیم امتیاز در تیمی از عاملهای یادگیر تقویتی است.دراین پژوهش ایده تقسیم امتیاز مبتنی بر دانش مطرح شده ، در قالب شبیه سازی یک سیستم نمونه و...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده مهندسی برق و کامپیوتر 1392

آلودگی صوتی یکی از معضلات جدی جوامع صنعتی می باشد. هر چند روش های متکی بر جذب صوت کاربردهای فراوانی داشته اما در فرکانس های پایین کارایی لازم را ندارند. برای غلبه بر این مشکل رویه های فعال برای حذف نویز ارائه گردیده اند. در این تحقیق نیز به منظور کاهش نویز صوتی به صورت فعال، ایده هایی مبتنی بر یادگیری تقویتی ارائه گردید. در این مسیر ابتدا برای سیگنال های تناوبی یک روش پیشنهاد شد که در آن نیازی ...

مهم‌ترین بخش در یک سیستم فازی پایگاه قواعد آن است. یکی از مشکلات موجود در تولید قواعد فازی با داده‌های آموزشی، وجود داده‌های ناسازگار است زیرا در این‌گونه داده‌ها چند خروجی برای وضعیت‌های یکسان وجود دارد. لذا تولید قواعد و تصمیم‌گیری برای انتخاب تالی مناسب برای هر قاعده با چالش همراه خواهد بود. روش‌های موجود از برآیند حالت‌های ناسازگار استفاده می‌کنند که باعث تولید خروجی با مقدار میانگین تالی‌ه...

ژورنال: کنترل 2014

در این مقاله یک روش جدید یادگیری تقویتی پیوسته برای مسائل کنترل ارائه می‌شود. روش ارائه شده از ترکیب روش "تکرار سیاست کمترین مربعات " با یک سیستم فازی سوگنوی مرتبه صفر حاصل شده و "تکرار سیاست کمترین مربعات فازی" نامیده شده است. در اینجا برای هر قاعده فازی تعدادی عمل نامزد در نظر گرفته می‌شود. هدف، یافتن مناسب‌ترین عمل نامزد (تالی) برای هر قاعده می‌باشد. با استفاده از بردار شدت آتش قواعد فازی و ...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی اصفهان - دانشکده برق و کامپیوتر 1386

شبکه های کامپیوتری نمونه مهمی از سیستم های پویای توزیع شده هستند که در زندگی روزانه نقش زیادی پیدا نموده اند. اهمیت استراتژیک و محدودیت های ذاتی این گونه سیستم ها منجر به نیاز به کنترل توزیع شده، به خصوص برای مسیریابی، می شود تا رفتار شبکه را قابل تطبیق با تغییرات در توپولوژی، ترافیک داده ها، سرویس ها و غیره نماید. اخیراً، محققین بر روی الگوریتم های مسیر یابی جدیدتری به منظور فراهم آوردن میزان ا...

ژورنال: کنترل 2011

مشکل تنگنای ابعاد، یکی از چالش هایی است که کاربرد الگوریتم های یادگیری تقویتی گسسته را در مورد مسائل کنترلی واقعی که دارای فضای حالت و عمل بزرگ و یا پیوسته می باشند محدود نموده است. ترکیب روش های آموزشی گسسته با تقریب زننده های تابعی برای حل این مشکل چندی است مورد توجه محققان قرارگرفته است. در همین راستا در این مقاله یک الگوریتم جدید یادگیری تقویتی عصبی (NRL) بر مبنای معماری نقاد- تنها معرف...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی خواجه نصیرالدین طوسی 1389

در این پایان نامه مسأله مسیریابی بهینه رباتها را در محیط هایی با چند هدف در تناقض باهم با استفاده از الگوریتم های یادگیری تقویتی چندهدفه مورد تحلیل و بررسی قرار می گیرد. اخیرا تحقیقات گسترده ای در زمینه بهینه سازی چندهدفه توسط محققین انجام شده است، نه تنها به علت ماهیت چندهدفه بودن اکثر مسائل دنیای واقعی، بلکه به علت اینکه هنوز بسیاری از سوال های بی جواب در این زمینه وجود دارد. به همین دلایل در...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی کامپیوتر 1384

با توجه به محدودیت های کاربردهای تجارت الکترونیکی سنتی، نیاز به نسل جدیدی از این کاربردها احساس می شود که با عنوان تجارت الکترونیکی با عامل واسط مطرح می شود. تغییرات عمده ای که تجارت الکترونیکی با عامل واسط ایجاد می کند این است که قیمت گذاری پویا و شخصی سازی پیشنهادها برای بسیاری از کالاها و مشتریان و فروشندگان معمول می گردد. عامل ها در این گونه از تجارت الکترونیکی در پنج مرحله می توانند نقش ...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده برق و کامپیوتر 1392

یکی از چالش های یادگیری تقویتی، عدم وجود الگوریتم های قابل اجرا در فضای حالت و عمل پیوسته است که دارای استدلال ریاضی باشند. در این پایان نامه سعی داریم با ارائه یک روش جدید یادگیری تقویتی پیوسته مبتنی بر معماری نقاد-تنها برای مسائل کنترل این چالش ها را برطرف کنیم. روش ارائه شده از ترکیب روش "تکرار سیاست کمترین مربعات" با یک سیستم فازی سوگنوی مرتبه صفر حاصل شده و "تکرار سیاست کمترین مربعات فازی"...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه شهید باهنر کرمان - دانشکده فنی 1393

انتخاب ویژگی تمرکز بسیاری از حوزه¬های تحقیقاتی در سال¬های اخیر را به خود جلب کرده است. با پیشرفت سریع فنّاوری کامپیوتری، پایگاه¬ داده¬هایی با صدها و هزاران ویژگی در شناسایی الگو، داده کاوی، یادگیری ماشین و… به وجود آمده است. به¬طوری¬که پردازش مجموعه داده¬های بزرگ، یک کار چالش برانگیز شده است. انتخاب ویژگی این مشکل را با از بین بردن داده¬های بی¬ربط، زائد یا نویزی حل می¬کند. این عمل کارایی الگوریت...

نمودار تعداد نتایج جستجو در هر سال

با کلیک روی نمودار نتایج را به سال انتشار فیلتر کنید