论文信息 - See, Think, Confirm: Interactive Prompting Between Vision and Language Models for Knowledge-based Visual Reasoning - 字舞流文

See, Think, Confirm: Interactive Prompting Between Vision and Language Models for Knowledge-based Visual Reasoning

Hao Zhang | Chuang Gan | Zhenfang Chen | Yikang Shen | Yining Hong | Qinhong Zhou | Qinhong Zhou