论文信息 - Meta-Reward-Net: Implicitly Differentiable Reward Learning for Preference-based Reinforcement Learning - 字舞流文

Meta-Reward-Net: Implicitly Differentiable Reward Learning for Preference-based Reinforcement Learning

Yaodong Yang | Yali Du | Runze Liu | Fengshuo Bai