نتایج جستجو برای: وزن دهی critic
تعداد نتایج: 69016 فیلتر نتایج به سال:
Deep reinforcement learning for multi-agent cooperation and competition has been a hot topic recently. This paper focuses on cooperative multi-agent problem based on actor-critic methods under local observations settings. Multi agent deep deterministic policy gradient obtained state of art results for some multi-agent games, whereas, it cannot scale well with growing amount of agents. In order ...
Example-based explanations are widely used in the effort to improve the interpretability of highly complex distributions. However, prototypes alone are rarely sufficient to represent the gist of the complexity. In order for users to construct better mental models and understand complex data distributions, we also need criticism to explain what are not captured by prototypes. Motivated by the Ba...
یکی از مهمترین منابع اطلاعاتی برای ارزیابی وضعیت حاصلخیری خاک، نقشه های حاصلخیزی خاک منطقه مورد مطالعه می باشد. تهیه این نوع نقشه ها به روش معمول به دلیل نیاز به تعداد زیاد نمونه و آزمایش های شیمیایی و فیزیکی پرهزینه بوده و عملاً در سطوح وسیع بسیار مشکل است. ازجمله راه های حل این موضوع بهره گیری از علم زمین آمار است که قادر به ارائه مجموعه وسیعی از تخمین گرهای آماری به منظور برآورد ویژگی های مور...
در این تحقیق سعی شده است تغییرات دما و بارش و همچنین بعضی از شاخص های حدّی موثر بر بخش کشاورزی در دوره اقلیمی 1418-1389 در سطح استان خراسان رضوی ارزیابی گردد. با استفاده از داده های آب وهوایی که توسط مدل gcm echo-g سناریوی a1 برای دوره آینده برآورد شده است، میزان تغییرات 8 شاخص موثر، نسبت به میانگین دوره گذشته محاسبه شده است. نتایج حاکی از افزایش متوسط درجه حرارت (5/0 درجه سلسیوسی)، طول دوره رشد...
اطلاعات، مبنا و خوراک اصلی تصمیم سازی و تصمیم گیری است. گاهی حجم اطلاعات به دست آمده به اندازه ای زیاد است که تجزیه و تحلیل همه آن ها مقدور نیست. اما استفاده از اطلاعات ناقص ممکن است که به تصمیمات اشتباه منجر شود. یکی از را ه های جلوگیری از این خطا استفاده از اطلاعات در قالب شاخص ها است. تعریف شاخص های کاربردی و کمی سازی متغیرهای کیفی در حوزه های مختلف علمی می تواند در کشف مشکلات اصلی، هدف گذار...
We demonstrate the use of qualitative models in the DHP method of training neurocontrollers. Two Fuzzy approaches to developing qualitative models are explored: a priori application of problem specific knowledge, and estimation of a first order TSK Fuzzy model. These approaches are demonstrated respectively on the cart-pole system and a non-linear multiple-inputmultiple-output plant proposed by...
نمودار تعداد نتایج جستجو در هر سال
با کلیک روی نمودار نتایج را به سال انتشار فیلتر کنید