论文信息 - PantheonRL: A MARL Library for Dynamic Training Interactions

PantheonRL: A MARL Library for Dynamic Training Interactions

We present PantheonRL, a multiagent reinforcement learning software package for dynamic training interactions such as round-robin, adaptive, and ad-hoc training. Our package is designed around flexible agent objects that can be easily configured to support different training interactions, and handles fully general multiagent environments with mixed rewards and n agents. Built on top of StableBaselines3, our package works directly with existing powerful deep RL algorithms. Finally, PantheonRL comes with an intuitive yet functional web user interface for configuring experiments and launching multiple asynchronous jobs. Our package can be found at https://github.com/Stanford-ILIAD/PantheonRL.

Dorsa Sadigh | Andy Shih | Bidipta Sarkar | Aditi Talati

[1] Willie Brink,et al. Mava: a research framework for distributed multi-agent reinforcement learning , 2021, ArXiv.

[2] Ananth Hari,et al. PettingZoo: Gym for Multi-Agent Reinforcement Learning , 2020, 2009.14471.

[3] Shimon Whiteson,et al. The StarCraft Multi-Agent Challenge , 2019, AAMAS.

[4] Michael I. Jordan,et al. RLlib: Abstractions for Distributed Reinforcement Learning , 2017, ICML.

[5] J. Schulman,et al. OpenAI Gym , 2016, ArXiv.

[6] Finale Doshi-Velez,et al. Hidden Parameter Markov Decision Processes: A Semiparametric Regression Approach for Discovering Latent Task Parametrizations , 2013, IJCAI.