论文信息 - CLIP Itself is a Strong Fine-tuner: Achieving 85.7% and 88.0% Top-1 Accuracy with ViT-B and ViT-L on ImageNet - 字舞流文

CLIP Itself is a Strong Fine-tuner: Achieving 85.7% and 88.0% Top-1 Accuracy with ViT-B and ViT-L on ImageNet

Fang Wen | Dong Chen | Lu Yuan | Nenghai Yu | Dongdong Chen | Jianmin Bao | Weiming Zhang | Shuyang Gu | Ting Zhang | Xiaoyi Dong