论文信息 - Are Vision-Language Transformers Learning Multimodal Representations? A Probing Perspective - 字舞流文

Are Vision-Language Transformers Learning Multimodal Representations? A Probing Perspective

S. Ayache | Emmanuelle Salin | Badreddine Farah | Benoit Favre