文
论文分享
演练场
杂货铺
论文推荐
字
编辑器下载
登录
注册
Ruihan Guo
发表
Learning Long-Term Reward Redistribution via Randomized Return Decomposition
pdf
Jian Peng, Yuan Zhou, Zhizhou Ren, 2021, ArXiv.