论文信息 - Represent Your Own Policies : Reinforcement Learning with Policy-extended Value Function Approximator - 字舞流文

Represent Your Own Policies : Reinforcement Learning with Policy-extended Value Function Approximator

Yaodong Yang | D. Graves | Wulong Liu | Jianye Hao | Hongyao Tang | Zhaopeng Meng | Chen Chen | Dong Li | Hangyu Mao | Changmin Yu