论文信息 - Clover: Towards A Unified Video-Language Alignment and Fusion Model - 字舞流文

Clover: Towards A Unified Video-Language Alignment and Fusion Model

Rongrong Ji | Jiashi Feng | Xiaoshuai Sun | Jingjia Huang | Yinan Li