2018年10月推出面向云到边缘基础设施产品Arm Neoverse,承诺在2022年以及更远的未来里,Neoverse平台能效将保持30%的年增长率持续更新。
后来这一承诺未被兑现,但Arm有了更加完善的产品规划,为其Neoverse部署了三个系列的产品,包括同时考虑性能、功率和面积,擅长可拓展的N系列;能够提供最佳性能,相对会消耗更多面积和功耗的V系列;更关注效率,在功耗和面积的缩减上进行优化的E系列。
本周四,Arm宣布其服务器芯片Arm Neoverse路线图再添新成员,同时推出Neoverse V2平台(代号“Demeter”)和Neoverse E2平台,服务器芯片适用范围将进一步扩大。
依然重视单线程性能,相比V1性能提升尚不明晰
在Arm看来,单芯片性能和单线程性能是云服务商选择服务器芯片的的两大关键指标,高单芯片性能能够让云服务商通过大量运行在平台上的“横向扩展”工作负载,帮其实现投资价值的最大化,即大型互联网公司所关注的TCO支出所能带来的性能。
因此单芯片和单线程性能是Arm Neoverse十分看重的一项性能指标。在现有市场上,使用 Arm Neoverse V1 核心的 AWS Graviton3 可提供最高的单线程性能。
在Arm同合作伙伴打磨Neoverse V2的过程中,也有客户表示希望能够提升云工作负载的性能,在平衡功耗和面积的同时继续推进单线程性能。
与Neoverse V1相比,Arm尚未给出Neoverse V2性能提升的详细信息,但在发布会上解释了Neoverse V2在提升性能方面所采取的措施。
在云工作负载方面,Arm使用了SPEC Integer Rate对预估值进行测量,并一直利用模型中的各种云基础设施工作负载对微架构进行调整,以提升整体可拓展性能。由于现代云应用程序拥有大型工作数据集,在接近CPU的位置保留尽可能多的数据,将带来更高的性能。Neoverse V2增加了2MB的专用L2缓存,比Neoverse V1的L2大一倍,同时保持延迟负载不变。
对于像HPC之类正快速迁移到云端的工作负载而言,矢量性能依然重要,机器学习(ML)正是未来的关键云工作负载。Neoverse V2完成了从SVE到SVE2的过渡,能够帮助满足更多非HPC ML类型的工作负载。
在安全方面,Neoverse V2引入了一些关键的Armv9安全增强功能,用于防御常见的内存攻击。
Arm推出的 Neoverse E2平台,结合 Arm Cortex-A510 CPU 与可扩展的 Neoverse CMN-700 和 N2 系统背板,如此一来,条件相对受限的应用也能充分利用诸如可扩展的核心数量范围、Arm SystemReady 兼容性以及 PCIe、CXL、IO 和接口等云技术。
英伟达Grace率先采用V2,每瓦性能提升2倍
目前,已有多家厂商正在基于V2进行设计,英伟达Grace CPU就是率先搭载V2的厂商之一。
Grace是英伟达“三芯”战略的一部分,基于Neoverse V2核心,可以提供多达72个核心,并通过英伟达最新的NVLink-C2C互连技术与GPU结合,致力于解决高性能应用方面的难题。
Grace为何会选择Arm Neoverse V2核心?在Arm发布会上,英伟达超大规模和HPC副总裁兼总经理Ian Buck给出解释:“将CPU与GPU这种作为解决AI等大规模数据并行问题的处理器相结合,我们需要一个表现优异的CPU与之并驾齐驱。我们对Neoverse V2的SPEC FP 与SPEC int性能表现印象非常深刻,也可与GPI本身的数据处理并驾齐驱。”
“另外,它的能效也很出色,本身具备优异的每瓦性能结合了 Grace 的 LP DDR 内存,与其替代品相比,这项结合带来了高达2倍以上的每瓦性能提升。因此我们非常高兴能够采用Arm的技术。”Ian Buck说道。
不止是英伟达,国内近两年兴起的CPU、DPU初创公司也正在基于Arm Neoverse核心做芯片开发。
在CPU领域,专注于打造服务器CPU的遇贤微电子和鸿钧微电子均采用Arm Neoverse核心。
遇贤微电子CEO及创始人罗勇表示,遇贤微研究了Arm Neoverse服务器架构可提供的机会和潜力,对数据中心和云原生而言非常出色。
目前,遇贤微正在为中国市场的云计算数据中心领域涉及基于Neoverse N2的服务器CPU,同时也正在与 Linaro 和 openEuler Linux 操作系统等 Arm 开源社区生态合作,支持多家软件供应商,确保大型互联网云计算服务提供商专用的Linux版本能够顺利无缝衔接到基于Neoverse N2服务器的CPU芯片上。
鸿钧微电子的第一款产品也是基于Neoverse N2打造,预计明年年底面世。
“我们正在与中国的广大客户进行交流,包括互联网公司、云服务提供商,以及传统的垂直行业客户,他们对此非常兴奋,并期待这款基于 Neoverse N2 的服务器 CPU 产品推出。”
在另一火热的DPU领域,云豹智能也在其SoC产品上采用了大量的Arm Neoverse CPU。
云豹智能首席架构师及联合创始人莫志城表示:“数据中心正在快速从以 CPU 为中心转变为以 DPU 为中心。因此,要应对这个趋势,我们必须优化我们的 DPU。它们不仅要能处理卸载并能非常高效地处理数据,而且必须具备高度灵活和可编程能力。由于我们的可编程 DPU 必须依赖于非常强大且非常高效的功率和高性能 CPU,例如下一代的 Neoverse。”