论文信息 - RoME: Role-aware Mixture-of-Expert Transformer for Text-to-Video Retrieval - 字舞流文

RoME: Role-aware Mixture-of-Expert Transformer for Text-to-Video Retrieval

Hanwang Zhang | J. Lim | Hongyuan Zhu | Burak Satar