论文信息 - Augmenting Vision Language Pretraining by Learning Codebook with Visual Semantics - 字舞流文

Augmenting Vision Language Pretraining by Learning Codebook with Visual Semantics

C.-C. Jay Kuo | J. Gichoya | Jiali Duan | Imon Banerjee | Xiaoyuan Guo