论文信息 - Optimistic Posterior Sampling for Reinforcement Learning with Few Samples and Tight Guarantees - 字舞流文

Optimistic Posterior Sampling for Reinforcement Learning with Few Samples and Tight Guarantees

R. Munos | Mark Rowland | É. Moulines | Daniele Calandriello | Pierre Ménard | A. Naumov | D. Belomestny | Daniil Tiapkin | M. Vaĺko | M. Rowland