文
论文分享
演练场
杂货铺
论文推荐
字
编辑器下载
登录
注册
Mixhead: Breaking the low-rank bottleneck in multi-head attention language models
复制论文ID
分享
摘要
作者
参考文献
暂无分享,去
创建一个
Qinli Yang
|
Junming Shao
|
Chongming Gao
|
Zhong Zhang
|
Rui Miao
|
Nian Shao
保存到论文桶