论文信息 - Can Pre-trained Vision and Language Models Answer Visual Information-Seeking Questions? - 字舞流文

Can Pre-trained Vision and Language Models Answer Visual Information-Seeking Questions?

Alan Ritter | Haitian Sun | Hexiang Hu | Soravit Changpinyo | Yi Luan | Yang Chen | Ming-Wei Chang