论文信息 - Question Aware Vision Transformer for Multimodal Reasoning - 字舞流文

Question Aware Vision Transformer for Multimodal Reasoning

Aviad Aberdam | Roy Ganz | Shai Mazor | Ron Litman | Oren Nuriel | Yair Kittenplon | Elad Ben Avraham