نتایج جستجو برای: الگوریتم یادگیری تقویتی فازی

تعداد نتایج: 52714  

ژورنال: کنترل 2012

: استفاده از یادگیری باناظر در ناوبری ربات های متحرک، با چالش های جدی از قبیل ناسازگاری و اختلال در داده ها، مشکل جمع آوری نمودن داده آموزش و خطای زیاد در داده های آموزشی مواجه می باشد. قابلیت های یادگیری تقویتی همچون عدم نیاز به داده آموزشی و آموزش تنها با استفاده از یک معیار اسکالر راندمان باعث کاربرد آن در ناوبری ربات شده است. از طرفی یادگیری تقویتی زمانبر بوده و دارای نرخ شکست های بالا در م...

Journal: : 2022

هدف اصلی این پژوهش ارائه چارچوبی برای ارزیابی عملکرد شرکت بهره‌­برداری قطار شهری مشهد بر مبنای کارت امتیازی متوازن و تکنیک تصمیم‌­گیری چندمعیاره (بهترین ـ بدترین فازی) است. حاضر از نظر هدف، کاربردی روش، کمّی اسنادی جمع‌­آوری داده‌های کیفی اساس 15 خبره در طی مقطع زمانی بین سال­‌های 1396 تا 1398 صورت پذیرفت. 9 معیار منظر مالی، 16 مشتریان، 8 فرایند داخلی 14 رشد توسعه یادگیری طریق اسناد پژوهش­‌های پ...

ژورنال: :کنترل 0
فاطمه فتحی نژاد fateme fathinezhad دانشگاه یزد ولی درهمی vali derhami دانشگاه یزد

: استفاده از یادگیری باناظر در ناوبری ربات های متحرک، با چالش های جدی از قبیل ناسازگاری و اختلال در داده ها، مشکل جمع آوری نمودن داده آموزش و خطای زیاد در داده های آموزشی مواجه می باشد. قابلیت های یادگیری تقویتی همچون عدم نیاز به داده آموزشی و آموزش تنها با استفاده از یک معیار اسکالر راندمان باعث کاربرد آن در ناوبری ربات شده است. از طرفی یادگیری تقویتی زمانبر بوده و دارای نرخ شکست های بالا در م...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه کردستان - دانشکده فنی 1393

در این پایان نامه آشکارسازی صورت به کمک فیلترهای هارمانند بهبود یافته بررسی شده است. یکی از مشکلات سیستم های آشکارسازی صورت مبتنی بر ویژگی های هارمانند، استفاده از دو مقدار 1+ و 1- برای بخش های مستطیلی شکل ویژگی ها و تأکید بر مستطیلی بودن ویژگی هاست که انعطاف پذیری و کارایی این ویژگی ها را کاهش می دهد. در این پایان نامه سه روش جدید برای طراحی ویژگی های هارمانند ارائه شده است. در اولین روش، که م...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده مهندسی برق و کامپیوتر 1391

استفاده از یادگیری باناظر در ناوبری ربات های متحرک، دارای چالش های جدّی همچون ناسازگاری داده ها، مشکل جمع آوری داده های آموزشی وخطای زیاد در این داده ها می باشد. لیکن استفاده از یادگیری تقویتی، که یک روش یادگیری تعاملی قدرتمند می باشد، مورد توجه واقع شد. از طرفی یادگیری تقویتی زمانبر بوده و دارای نرخ شکست های بالا در مرحله آموزش می باشد. از این رو در این پایان نامه، یک ایده جدید برای استفاده موثّ...

ژورنال: :مجله دیابت و متابولیسم ایران 0
حسین فرضعلی وند hossein farzalivand khozestan, izeh, zagros street, izeh branch, islamic azad university, young researchers club phone: 09384221895خوزستان، ایذه، خیابان زاگرس، میدان دانشجو، دانشگاه آزاد اسلامی واحد ایذه، باشگاه پژوهشگران و نخبگان تلفن: 09384221895

مقدمه: یکی از عوارض خطرناک بیماری دیابت نوع یک افزایش و کاهش ناگهانی سطح غلظت قند خون می باشد که باعث بروز خطراتی چون اغماء و بیهوشی خواهد شد. بنابراین استفاده از روش هایی با درصد خطای پایین و هوشمند با اطلاعات موجود در جهت پیش بینی و در نهایت پیشگیری از این عوارض،گام مهمی در جهت کنترل بهینه بیماری محسوب می شود. به همین منظور در این مقاله ما از الگوریتم ترکیبی fuzzy sarsa برای طراحی سیستم خبره ...

ژورنال: کنترل 2014

در این مقاله یک روش جدید یادگیری تقویتی پیوسته برای مسائل کنترل ارائه می‌شود. روش ارائه شده از ترکیب روش "تکرار سیاست کمترین مربعات " با یک سیستم فازی سوگنوی مرتبه صفر حاصل شده و "تکرار سیاست کمترین مربعات فازی" نامیده شده است. در اینجا برای هر قاعده فازی تعدادی عمل نامزد در نظر گرفته می‌شود. هدف، یافتن مناسب‌ترین عمل نامزد (تالی) برای هر قاعده می‌باشد. با استفاده از بردار شدت آتش قواعد فازی و ...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه شهید باهنر کرمان - دانشکده مهندسی 1393

طراحی کنترل کننده های فازی با استفاده از الگوریتم های تکاملی و یادگیری تقویتی q - فازی موضوعی است که در کنترل ربات ها نقش مهمی ایفا می کند. در این پایان نامه سه روش پیشنهادی برای حل مسائل کنترلی فازی تقویتی ارائه گردیده است و هر سه این روش ها روی یک مسئله فازی تقویتی به نام، ماشین عقب رونده به سمت بالا، شبیه سازی شده اند و همه ی این روش ها از ترکیب یادگیری q-فازی با یک الگوریتم بهینه سازی ایجاد...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده برق و کامپیوتر 1392

یکی از چالش های یادگیری تقویتی، عدم وجود الگوریتم های قابل اجرا در فضای حالت و عمل پیوسته است که دارای استدلال ریاضی باشند. در این پایان نامه سعی داریم با ارائه یک روش جدید یادگیری تقویتی پیوسته مبتنی بر معماری نقاد-تنها برای مسائل کنترل این چالش ها را برطرف کنیم. روش ارائه شده از ترکیب روش "تکرار سیاست کمترین مربعات" با یک سیستم فازی سوگنوی مرتبه صفر حاصل شده و "تکرار سیاست کمترین مربعات فازی"...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1391

یادگیری تقویتی همچونبرنامه ریزی پویادر حل مسائل با فضای حالت پیوسته با چالش نفرین ابعادروبروست. تعمیم ارزش یک حالت به سایر حالت های مجاوربا استفاده از تقریبگرهای عمومی یکی از راهکارهایی است که برای حل این مسئله پیشنهادشده است. در این روش عامل مجموعه ای محدود از فضای حالت را تجربه می کند و از طریق تعمیم دهی تقریب خوبی از کل فضا را بدست می آورد. یکی از بهترین تقریبگرهای عمومیسیستم های فازی اند. د...

نمودار تعداد نتایج جستجو در هر سال

با کلیک روی نمودار نتایج را به سال انتشار فیلتر کنید