论文信息 - Learning to Score Behaviors for Guided Policy Optimization - 字舞流文

Learning to Score Behaviors for Guided Policy Optimization

Michael I. Jordan | K. Choromanski | A. Choromańska | Jack Parker-Holder | Aldo Pacchiano | Yunhao Tang