论文信息 - Semantics-enhanced Cross-modal Masked Image Modeling for Vision-Language Pre-training - 字舞流文

Semantics-enhanced Cross-modal Masked Image Modeling for Vision-Language Pre-training

Yaya Shi | Chunfen Yuan | Haiyang Xu | Chenliang Li | Qinghao Ye | Mingshi Yan | Fei Huang | Haowei Liu | Weiming Hu | Ji Zhang | Bing Li