论文信息 - ViLT-CLIP: Video and Language Tuning CLIP with Multimodal Prompt Learning and Scenario-Guided Optimization - 字舞流文

ViLT-CLIP: Video and Language Tuning CLIP with Multimodal Prompt Learning and Scenario-Guided Optimization

Zehua Hao | Lingling Li | Xu Liu | Puhua Chen | Jiahao Wang | Fang Liu | Hao Wang | Licheng Jiao | Shuo Li