论文信息 - Training Nonlinear Transformers for Efficient In-Context Learning: A Theoretical Learning and Generalization Analysis - 字舞流文

Training Nonlinear Transformers for Efficient In-Context Learning: A Theoretical Learning and Generalization Analysis

Hongkang Li | Meng Wang | Pin-Yu Chen | Songtao Lu | Xiaodong Cui