论文信息 - Revisiting Knowledge Distillation for Autoregressive Language Models - 字舞流文

Revisiting Knowledge Distillation for Autoregressive Language Models

Juhua Liu | Liang Ding | Qihuang Zhong | Bo Du | Li Shen | D. Tao