文
论文分享
演练场
杂货铺
论文推荐
字
编辑器下载
登录
注册
Towards Practical and Efficient Image-to-Speech Captioning with Vision-Language Pre-training and Multi-modal Tokens
复制论文ID
分享
摘要
作者
参考文献
暂无分享,去
创建一个
Shinji Watanabe
|
Y. Ro
|
Minsu Kim
|
Soumi Maiti
|
Jeong Hun Yeo
|
J. Choi
保存到论文桶