Dawning Nebulae: A PetaFLOPS Supercomputer with a Heterogeneous Structure

破晓的星云一个异构的系统由 9280 个多核心 x86 中央处理器和 4640 NVIDIA 费密 GPU 组成。与 1.271 petaFLOPS 的 Linpack 表演,它被评价第二在在 2010 年 6 月释放的 TOP500 表。在这篇论文,在破晓的星云的系统设计的关键问题被介绍。瞄准 petaFLOPS Linpack 结果的系统调节方法论被介绍,包括算法的优化和通讯改进。包括 HVFS 和内在的 DCFS3,它的文件 I/O 分系统的设计也被描述。表演评估显示出,并且 1024 节点总数读并且写带宽每个节点的 Linpack 效率到达 69.89% 分别地超过 100 GB/s 和 70GB/s。破晓的星云的成功为超级计算机的未来图案表明了 CPU/GPU 异构的结构的生存能力。