论文信息 - On Reinforcement Learning and Distribution Matching for Fine-Tuning Language Models with no Catastrophic Forgetting - 字舞流文

On Reinforcement Learning and Distribution Matching for Fine-Tuning Language Models with no Catastrophic Forgetting

Germán Kruszewski | Marc Dymetman | Tomasz Korbak | Hady ElSahar