低调深耕十年,Arm这项业务有望迎来爆发!

得益于智能手机和嵌入式应用的蓬勃发展,Arm在过去十年里成为了芯片领域的绝对赢家(www.shouxue.net)。尤其是在智能手机领域,Arm提供的内核几乎被每一款手机的芯片所采用。而Arm在这个过程中没也没有掉链子,针对市场需求推出了相应的产品。

然而,Arm其实在过去十年里并没有安于现状,他们不仅仅只是围绕着当前的“甜点”做迭代。与此同时,Arm还在面向未来做更深远的布局,基础设施就是他们其中的一个目标。

Arm基础设施事业部高级副总裁兼总经理 Chris Bergey在日前的一场媒体会上告诉记者,Arm在相关业务已经深耕了十年。而Neoverse就是他们交出的一份“答卷”。

面向基础设施的Neoverse系列

谈到Arm,大多数人应该都会听过其Arm Cortex-M系列和Arm Cortex-A系列,正是这两系列的产品帮助公司在过去十几年飞速成长。而上文谈到的Neoverse则是Arm最近正在大张旗鼓推崇的一个东西。在很多分析师看来,英伟达收购Arm公司,正是看中Arm在这方面的潜力。

众所周知,因为人工智能、5G和大数据的崛起,市场上涌现了各种各样的新兴应用,这就给拥有高性能和低功耗的Arm内核带来了机会,这正是Neoverse诞生的原因。

资料显示,Arm公司最早是在 Arm Techcon 2018上首次披露Neoverse路线图,根据Arm公司的专家当年在博客中强调,Arm Neoverse为万亿联网设备描绘了安全、高性能、灵活的从云到边缘计算的愿景。Arm甚至表示,如果没有公司正在引导的变革,现有的基础设施将在即将来临的数据洪流中逐渐腐朽和消亡。

按照Arm的说法,这主要是因为业界过去几乎把所有数据都发送到由单一、过时、通用的计算架构驱动的远程服务器,而今这样的时代已经一去不复返。相反,计算必须通过演化,在最佳节点实现分布式处理,并提供连接端边云的异构计算,从而使正确的资源可以在正确的节点分层。

Chris Bergey在媒体会上则告诉记者,按照他们的规划,这个全新系列将会面向四个市场。分别是超大型计算&云计算、HPC、5G和基础设施边缘。

根据Arm最初的规划,Neoverse品牌当时的平台产品代号Cosmos,基于16nm工艺,CPU核心是A72和A75,下一代将是2019年推出的Ares平台,制程工艺升级到7nm,2020年则会升级到Zeus平台,使用7nm EUV工艺,而2021年则是面向5nm工艺的Poseidon平台。如图所示,Arm为每一代平台规划了30%左右的性能提升。

如下图所示,Arm最初为其Neoverse带来了E系列和N系列两款产品。但到了2020年9月,Arm不仅展示了先前称为Zeus的CPU微体系结构,而且还展示了Neoverse N系列以外的全新产品类别:推出新的Neoverse V系列和Neoverse V1(Zeus),以及以Neoverse N2(Perseus)形式出现的新路线图。

值得一提的是,N2的代号在之前的规划在之前并没有看到,而从相关资料显示,Neoverse V1形式的Zeus微体系结构实质上类似于Arm在移动领域的Cortex-X1 CPU:专注于最大性能,而对功耗和面积的关注较少。

在去年十月发布的时候,Arm并没有介绍关于这两个新产品的更多细节。而在日前的媒体会上,Arm终于揭开了他们的神秘面纱。

N2和V1性能的全面跃升

在上文中我们谈到,2019年推出的Neoverse N1 是Arm这个系列新命名的第一款产品。相关报道指出,该产品的设计很大程度上类似于 Arm 面向消费级市场的 Cortex-A76 微体系架构:其具有 4 层访存 / 解码器,流水线深度仅 11 级,并且能够在必要时减少至 9 级。

此外,Neoverse N1 设计为在相对较高的频率下运行,以提供最大的单线程性能,且具有不同于寻常的 1MB L2 缓存体系结构(缓存本身不该算是体系结构的一部分)和其它一些增强功能。有厂商(如亚马逊)基于此设计出了备受欢迎的产品。

来到Neoverse N2,据介绍,这是一款基于Arm全新的V9架构设计的产品,同时也是第一个基于Armv9架构的平台。与N1相比,Neoverse N2在保持相同水平的功率和面积效率的基础上,单线程性能提升了40%。

Arm方面进一步指出,Neoverse N2 具备良好的可扩展性,可以横跨从高吞吐量计算到功率与尺寸受限的边缘和5G应用场景,并在这些应用中带来优于N1的表现,例如,在云端上提升 1.3 倍的NGINX,在 5G 和边缘应用上提升 1.2 倍的DPDK 数据包处理。

Arm方面同时还表示,Neoverse N2平台提供了优异的单线程性能和业界领先且能为用户减少TCO的每瓦性能表现。同时,作为第一个具备SVE2功能的平台,Neoverse N2可为云到边缘的性能效率带来巨大的提升。在诸如机器学习、数字信号处理、多媒体和5G等广泛应用场景中,SVE2除了带来大幅性能提升外,还带来了SVE 具备的编程简易性及可移植性等优势。

“N2效率配置使我们能够在单插槽线程上具有更大的竞争力,同时提供专属的内核,而非共享线程。随着我们越来越靠近边缘,问题的性质悄然发生变化”, Chris Bergey强调。

来到V1方面,按照Arm的说法,这将是一款带动高性能计算变革的产品。

资料显示,与N1相比,Neoverse V1带来了 50%的性能提升、1.8倍的矢量工作负载优化、以及4倍的机器学习工作负载优化,同时,Neoverse V1也是Arm强调性能优先的新型计算系列的第一个平台。Neoverse N1使芯片合作伙伴能灵活地为高度依赖CPU性能和带宽的应用构建计算能力,并为其提供 SoC 设计的灵活性。

秉持性能至上的思维,Neoverse V1 的设计理念创造了Arm迄今为止设计过的最宽微架构,以便容纳更多运行中的指令,支持高性能和百万兆级计算等市场应用。Neoverse V1宽而深的架构,加上 SVE功能将使其在单核性能和通过SVE延长代码存活期等方面占据领先优势,并为芯片设计人员提供可实现的灵活性。

Chris Bergey告诉记者,SVE 为Arm开发者提供了一套全新的矢量编程和数据操作工具,解决Arm现有的 SIMD 指令集 NEON 难以对某些代码进行矢量化处理的问题。据介绍,SV 可以直接取用相同的代码,并很好地对其进行自动矢量化,相比于NEON,可提速将近 3.5 倍的处理速度。

“由于 SVE 与矢量长度无关,因此相同的代码可以不加修改地在 V1 上运行。如果在 V1 上加倍 SVE 矢量的宽度,则对应的处理速度也几乎提速一倍。SVE同时也为 HPC 提供了一种新的高性能且对开发者友好的编程功能”,Chris Bergey接着说。

在介绍V1和N2的同时,Chris Bergey还着重介绍了公司新推出的Arm Neoverse CMN-700 。作为业界最先进的 mesh 互连技术,CMN-700能充分发挥 Neoverse V1 和 N2 平台的性能与每瓦性能优势。Chris Bergey也强调,构建基于 V1 和 N2 高性能 SoC 的关键要素就是 Arm CMN-700 Mesh 互连技术。

据介绍,基于CMN-600的成功基础,CMN-700在每个矢量上进一步提升了性能——从内核的数量、缓存的大小,到附加内存及 IO 设备的数量和类型。它所支持的高带宽 DDR5 和 HBM 内存,正是实现于 V1 HPC 平台的关键。

据Chris Bergey介绍,CMN-700 的一个关注重点是对多芯片功能的助益,以便为数据中心资源池化的增长提供更多的定制选项;同时,CMN-700 中还增加了 CXL 功能,可为内存扩展和智能一致性加速器,构建主机或端点设备;多芯片功能的另一项重要升级是,针对传统多插槽设计和新的芯片集或多芯片集成提高性能和优化功能;多芯片集成将为突破传统的硅掩模版限制提供新的机遇,并为紧密耦合的异构计算提供更大的灵活性。

正是得益于这些设计,CMN-700 赋能了多芯片、内存扩展和加速器的下一代应用场景实现。

携手生态伙伴走向新未来

在过去谈Arm在基础设施,尤其是他们服务器芯片的时候。大家第一个想提出的问题,就是如何解决软件乃至生态的问题。但在Arm看来,这不再是困扰。

首先在芯片方面,Amazon、Ampere Computing、Sipearl、ETRI和Marvell等企业参与,基于Arm Neoverse设计芯片,让终端开发者有了芯片选择。与此同时,Arm与生态链上各个环节建立了合作,让这一切成为可能。

Chris Bergey表示,此前,Arm从来没有在这类的 IP 实现上投入过如此多的资源。但现在,公司与领先的晶圆代工厂深入合作,在多个先进的工艺节点上开发出了性能和功耗优化的POP IP。

而随着 “Project Cassini ” 和 “Arm SystemReady” 的启动,Arm的标准和认证项目计划正持续推进,并逐步扩展到基础设施和物联网边缘。公司在平台标准化方面取得了长足的进展。这就意味着在广泛的 Arm 合作伙伴芯片和设备,可以 “直接运行” 更多现成的标准操作系统云原生软件生态系统可以越来越顺畅地将其堆栈集成到 Arm 平台上 而客户也能更加顺利地从云端到边缘部署中受益。

正式在多方的联合推动下,基于Arm Neoverse设计的芯片正在走向多个领域。

据了解,印度电子信息技术部(MeitY)已宣布将加入法国芯片公司 SiPearl 和韩国电子通信研究所( ETRI)的行列,采用Neoverse V1驱动国家级百万兆级高性能计算项目;甲骨文也计划在Oracle云基础设施上采用Ampere Altra CPU,为各种工作负载提供最佳的性价比;由Arm技术驱动的AWS Graviton2通过稳定的增长与区域扩展,正持续快速地扩张其EC2的覆盖;阿里云在即将上线的基于Arm架构ECS 实例上完成了测试,结果显示在 SPECjbb的测试数据中获得了惊艳的表现,且基于Arm架构运行的 DragonWell JDK 性能提高了 50%;腾讯在硬件测试和软件支持方面持续投入,使其在云应用上能采用 Arm Neoverse 技术。

“展望下一个计算时代,我们想要改变行业对部署基础设施的思维。每一个创新者都不应该被要求在性能与能耗之间进行抉择, Neoverse 平台提供了两者兼得的最佳解决方案,促使从云到边缘的广泛应用能够实现。”Chris Bergey说。

*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。

今天是《半导体行业观察》为您分享的第2662内容,欢迎关注。

实时 专业 原创 深度

主营产品:油冷机,排屑机,变频水冷机,冷水机,主轴**出水