论文信息 - Reward modeling for mitigating toxicity in transformer-based language models - 字舞流文

Reward modeling for mitigating toxicity in transformer-based language models

Jia Yuan Yu | K. Schmitt | Farshid Faal | Jiawei Yu