论文信息 - Space-Time Crop & Attend: Improving Cross-modal Video Representation Learning - 字舞流文

Space-Time Crop & Attend: Improving Cross-modal Video Representation Learning

João F. Henriques | Yuki M. Asano | A. Vedaldi | Ishan Misra | Florian Metze | Mandela Patrick | Bernie Huang