论文信息 - X-CLIP: End-to-End Multi-grained Contrastive Learning for Video-Text Retrieval - 字舞流文

X-CLIP: End-to-End Multi-grained Contrastive Learning for Video-Text Retrieval

Ming Yan | Rongrong Ji | Xiaoshuai Sun | Yiwei Ma | Guohai Xu | J. Zhang | Ji Zhang