论文信息 - SnapNTell: Enhancing Entity-Centric Visual Question Answering with Retrieval Augmented Multimodal LLM - 字舞流文

SnapNTell: Enhancing Entity-Centric Visual Question Answering with Retrieval Augmented Multimodal LLM

Paul A. Crook | B. Damavandi | Andrea Madotto | Zhaojiang Lin | Xin Luna Dong | Jielin Qiu | Seungwhan Moon | Christos Faloutsos | Lei Li | Y. Xu