论文信息 - Dyna-PPO reinforcement learning with Gaussian process for the continuous action decision-making in autonomous driving - 字舞流文

Dyna-PPO reinforcement learning with Gaussian process for the continuous action decision-making in autonomous driving

Wenqi Fang | Guanlin Wu | Jiang Cao | Peng Gou | J. Wang | Pin Ge | Yang Ping