论文信息 - Position embedding fusion on transformer for dense video captioning - 字舞流文

Position embedding fusion on transformer for dense video captioning

Hanli Wang | Qinyu Li | Pengjie Tang | Sixuan Yang