论文信息 - Multi-Grained Vision Language Pre-Training: Aligning Texts with Visual Concepts - 字舞流文

Multi-Grained Vision Language Pre-Training: Aligning Texts with Visual Concepts

Hang Li | Yan Zeng | Xinsong Zhang