论文信息 - Fine-Tuning Language Models from Human Preferences - 字舞流文

Fine-Tuning Language Models from Human Preferences

Tom B. Brown | Daniel M. Ziegler | Nisan Stiennon | Jeff Wu | Alec Radford | Dario Amodei | Paul Christiano | G. Irving