نتایج جستجو برای: exploration
تعداد نتایج: 84064 فیلتر نتایج به سال:
2006
Youssef Achbany
Francois Fouss
Luh Yen
Alain Pirotte
Marco Saerens
This paper presents a model allowing to tune continual exploration in an optimal way by integrating exploration and exploitation in a common framework. It first quantifies exploration by defining the degree of exploration of a state as the entropy of the probability distribution for choosing an admissible action. Then, the exploration/exploitation tradeoff is formulated as a global optimization...
نمودار تعداد نتایج جستجو در هر سال
با کلیک روی نمودار نتایج را به سال انتشار فیلتر کنید