论文信息 - Grounding Large Language Models in Interactive Environments with Online Reinforcement Learning - 字舞流文

Grounding Large Language Models in Interactive Environments with Online Reinforcement Learning

Olivier Sigaud | Thomas Wolf | Thomas Carta | P. Oudeyer | S. Lamprier | Clément Romac