论文信息 - VLCDoC: Vision-Language Contrastive Pre-Training Model for Cross-Modal Document Classification - 字舞流文

VLCDoC: Vision-Language Contrastive Pre-Training Model for Cross-Modal Document Classification

Mickaël Coustaty | Zuheng Ming | Souhail Bakkali | Marccal Rusinol | O. R. Terrades