نتایج جستجو برای: وزن دهی critic

تعداد نتایج: 69016  

1997
Danil V. Prokhorov

This paper discusses convergence issues when training adaptive critic designs (ACD) to control dynamic systems expressed as Markov sequences. We critically review two published convergence results of critic-based training and propose to shift emphasis towards more practically valuable convergence proofs. We show a possible way to prove convergence of ACD training.

2000
Thaddeus T. Shannon George G. Lendaris

A variety of methods for developing quasi-optimal intelligent control systems using reinforcement learning techniques based on adaptive critics have appeared in recent years. This paper reviews the family of approximate dynamic programming techniques based on adaptive critic methods and introduces a new hybrid critic training method.

2001
Ernest L. Hall

An intelligent robot is a remarkably useful combination of a manipulator, sensors and controls. The use of these machines in factory automation can improve productivity, increase product quality and improve competitiveness. This paper presents a discussion of recent and future technical and economic trends. During the past twenty years the use of industrial robots that are equipped not only wit...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه علوم کشاورزی و منابع طبیعی گرگان - دانشکده علوم کشاورزی 1388

داده های مورد استفاده در این پژوهش شامل اوزان تولد، شیرگیری، 6 ماهگی، 9 ماهگی و یکسالگی 7072 بره گوسفند نژاد بلوچی است که در سالهای 1361 تا 1385 در ایستگاه اصلاح نژاد عباس آباد مشهد رکوردگیری و جمع آوری شده بود. این داده ها برای برآورد روند ژنتیکی، فنوتیپی و محیطی مورد استفاده قرار گرفت. ارزش اصلاحی حیوانات با روش معادلات مدل مختلط و براساس مدل دام یک متغیره پیش بینی شد. روند فنوتیپی، ژنتیکی و ...

هدف از پژوهش حاضر شناسایی وزن هریک از دروس سوابق تحصیلی و نمره کل سازی براساس رویکرد روانسنجی مدل پیوسته IRT و رویکردهای مبتنی بر نظر متخصصان تاپسیس و AHP، و همچنین مقایسه اثر مدل وزن دهی بر رتبه بندی و پایایی روش های وزن دهی و نمره کل سازی سوابق تحصیلی بود. روش پژوهش حاضر ترکیبی بود. به منظور اجرای پژوهش در بخش اول 11 آیتم(دروس) سوابق تحصیلی از گروه متخصصان مورد نظرخواهی قرار گرفت و با استفاده...

2003
Rémi Coulom

This paper presents a model-based actorcritic algorithm in continuous time and space. Two function approximators are used: one learns the policy (the actor) and the other learns the state-value function (the critic). The critic learns with the TD(λ) algorithm and the actor by gradient ascent on the Hamiltonian. A similar algorithm had been proposed by Doya, but this one is more general. This al...

Journal: :JAMA: The Journal of the American Medical Association 1897

Journal: :Journal of Medical Ethics 1988

Journal: :The New Zealand Annual Review of Education 1996

نمودار تعداد نتایج جستجو در هر سال

با کلیک روی نمودار نتایج را به سال انتشار فیلتر کنید