论文信息 - MVP: Multi-Stage Vision-Language Pre-Training via Multi-Level Semantic Alignment - 字舞流文

MVP: Multi-Stage Vision-Language Pre-Training via Multi-Level Semantic Alignment

Zhongyu Wei | Zhihao Fan | Zejun Li | Huaixiao Tou