نتایج جستجو برای: action value function

تعداد نتایج: 2342819  

Journal: :Nippon Jibiinkoka Gakkai Kaiho 1928

Journal: :Progress of Theoretical and Experimental Physics 2014

Journal: :The Journal of Japan Institute of Navigation 1997

Journal: :IEEJ Transactions on Electronics, Information and Systems 2006

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی خواجه نصیرالدین طوسی - دانشکده مهندسی مکانیک 1392

در این پایان نامه ربات متحرک چرخ دار به همراه دو تریلر مورد تحلیل و بررسی قرار می گیرد. در ابتدا سیستم مورد نظر معرفی شده و تمامی فرضیات هندسی و مشخصات جرمی مورد نیاز بیان می شود. در بخش بعد، بردار مختصات تعمیم یافته ربات و همچنین بردار ورودی مدل سینماتیکی ربات در نظر گرفته شده و در نتیجه سینماتیک مستقیم ربات حاصل می شود. از روی مدل سینماتیکی ربات، ماتریس ژاکوبین را می توان استخراج کرد. با توجه...

Journal: :The Journal of neuroscience : the official journal of the Society for Neuroscience 2012
Miriam Cornelia Klein-Flügge Sven Bestmann

Our choices often require appropriate actions to obtain a preferred outcome, but the neural underpinnings that link decision making and action selection remain largely undetermined. Recent theories propose that action selection occurs simultaneously, i.e., parallel in time, with the decision process. Specifically, it is thought that action selection in motor regions originates from a competitiv...

A. El Houasni A. Khadari M. El Hamma R. Daher

Using a generalized spherical mean operator, we obtain the generalizationof Titchmarsh's theorem for the Dunkl transform for functions satisfyingthe Lipschitz condition in L2(Rd;wk), where wk is a weight function invariantunder the action of an associated reection groups.

Background and Objectives: Action recognition, as the processes of labeling an unknown action of a query video, is a challenging problem, due to the event complexity, variations in imaging conditions, and intra- and inter-individual action-variability. A number of solutions proposed to solve action recognition problem. Many of these frameworks suppose that each video sequence includes only one ...

2011
Hunor Jakab Lehel Csató

Gradient based policy optimization algorithms suffer from high gradient variance, this is usually the result of using Monte Carlo estimates of the Qvalue function in the gradient calculation. By replacing this estimate with a function approximator on state-action space, the gradient variance can be reduced significantly. In this paper we present a method for the training of a Gaussian Process t...

نمودار تعداد نتایج جستجو در هر سال

با کلیک روی نمودار نتایج را به سال انتشار فیلتر کنید