论文信息 - Offline Reinforcement Learning for Optimizing Production Bidding Policies - 字舞流文

Offline Reinforcement Learning for Optimizing Production Bidding Policies

D. Korenkevych | Alex Nikulkov | Zheqing Zhu | Frank Cheng | Artsiom Balakir | Lingnan Gao | Zhihao Cen | Zuobing Xu