论文信息 - Value-free reinforcement learning: Policy optimization as a minimal model of operant behavior - 字舞流文

Value-free reinforcement learning: Policy optimization as a minimal model of operant behavior

Y. Niv | Angela J. Langdon | D. Bennett