服务器上的ARM处理器已经从失败的开始(Calxeda公司),以适度的成功(ThunderX2)真正的竞争者(ThunderX3,安培)不见了。现在,细节都出现了关于日本IT巨头富士通的ARM处理器,它声称将提供比NVIDIA GPU的,但在一个较低的电力成本更好的HPC性能。
富士通正在开发A64FX,专门设计用于高性能计算(HPC)48芯ARM8衍生物。而不是设计的通用计算核心,富士通已经加入计算引擎专门针对人工智能,机器学习等技术专门针对高性能计算的需求。
它会在一个名为Fugaku新的超级计算机,或后-K。后-K是去K超级计算机的参考,同时是世界上最快的超级计算机,上RIKEN实验室,在那里它被安装,之前定制Sparc芯片跑去拉插头。
富士通日前透露了一些新的细节,他们是令人印象深刻。该A64FX的设计是从传统的设计是一大飞跃。相反,AMD EPYC一些至强处理器的小芯片设计的,它是一个单一的整体设计。更重要的是,有高带宽存储器2(HBM2),仅在高端系统中使用的昂贵的,但非常快的存储器的四个芯片,连接到CPU。两个8GB模块被放置在CPU的每一侧。
在A64FX主板的原型揭示它没有内存DIMM插槽。Intel或AMD主板将呈现多达十几内存DIMM插槽,每个CPU,但A64FX主板有没有。这是因为A64FX对每个CPU芯片的32GB的内存HBM2。
在HPC,内存带宽一直是瓶颈,以及数据分析一样,模拟和机器学习密集型工作负载正在放缓下来。而更多的权力 - 高达100倍之多 - 是在HPC中移动的数据比实际处理它用。因此,要实现节能,数据需要移动尽可能少。
所以A64FX有一个完全不同的设计,比你的标准的ARM或x86芯片。没有一个系统存储器,每一个经由高速互连,而不是通过一个慢得多的存储器总线直接连接到所述芯片极快存储器的处理器只是32GB。这将大大减少延迟CPU和内存之间,也降低功耗,因为数据没有进出内存插槽的移动。
所述48个内核像它们由一个非常快的互连称为豆腐,这是首次在K超级计算机使用,并在A64FX已经前进连接的GPU的A64FX功能。豆腐是专为能源效率和低延迟。而被10倍以上的功率比的x86处理器高效A64FX能够峰值带宽3Tflops的。
甲Fugaku原型制成的头号点上的Green500列表中,通过做前500强超级计算机名单,这是一个原型,而不是最后的设计同组公布的最节能的超级计算机名单。
在早期的基准富士通声称痛击至强白金,英特尔的顶线,并与HPC GPU的NVIDIA的沃尔特线的竞争力。然而这还不是最终的硅,我总是等待第三方基准。
所以,你为什么要在乎?由于富士通触动了Cray公司达成协议,利用A64FX使HPC服务器和下克雷品牌进行销售。克雷自此由惠普企业买断,所以HPE将兜售不是一个而是两个基于ARM的服务器,它更多的主流项目登月的服务器,并A64FX。
还有就是技术的悠久历史开始在HPC慢慢成为主流,从GPU计算液体冷却到模块化服务器设计。没有理由的A64FX不能成为主流要么,把AI,ML,和其它高性能的任务不仅仅是超级计算设施。
该HBM2 /无的DIMM是对系统内存进行大量的扭曲,我真的很好奇,看看英特尔和AMD跟进。