协同多核DSP YHFT-QMBase: 体系结构及实现

在信号处理领域的优异表现使得Vector-SIMD 结构在近年来获得了广泛的关注. Vector-SIMD结构和多核技术相结合是目前高性能DSP 体系结构发展的重要方向. 然而, 在目前的多核Vector-SIMD 处理器中某些部件间的协同工作能力还比较弱, 导致了系统的整体性能得不到有效发挥. 本文设计实现了一款协同多核DSP YHFT-QMBase, 从4 个方面增强了多核Vector-SIMD 体系结构的协同性: (1) 采用动态耦合机制重定义了标量单元和向量单元的工作方式; (2) 采用矩阵方式的通信机制增强了向量Lane 间的交互能力; (3) 采用非对齐向量存储访问机制解决了向量存储器的数据共享问题; (4) 采用Qlink-Crossbar 机制满足了多核间后台高效粗粒度数据搬移的需求. 评估结果显示, 本文提出的协同增强机制能够使传统的Vector-SIMD 结构获得58.5% 的性能提升. 目前YHFT-QMBase已经成功流片, 评测结果显示其峰值浮点乘加能力(单精度) 达到32 GFMACS, 定点运算能力(16 位)为128 GMACS, 典型功耗为8.65 W.