AMD、Intel之间的服务器与数据中心处理器大战硝烟再起,战况空前!
Intel正在陆续发布全新设计的第六代至强6系列,AMD则祭出了同样全新的第五代EPYC 9005系列,可谓针尖对麦芒。
曾经,AMD在服务器与数据中心市场上几近消失;曾经,Intel几乎完全垄断了整个行业。
七年来,双方进行了一次又一次激烈交锋,AMD无疑气势更盛,无论产品发布节奏还是规格性能提升,都步步为营,一点一点改变了行业格局,第三方机构统计显示市场份额已经达到34%,合作生态也日渐繁荣。
Intel在对手的强势挑战之下,也是一路马不停蹄,一度因产品延期导致的混乱也终于过去,正在重新起航。
这一次,双方都是有备而来,都是气势如虹,究竟谁更胜一筹呢?
【架构设计:都是"大小核" 但又截然不同】
有趣的是,AMD、Intel都将所谓的"大小核"架构设计引入到了数据中心,但具体做法是完全不同的,这也直接导致双方产品的实际表现迥异。
AMD的做法是"同构大小核",之前的第四代EPYC率先吃螃蟹,首次划分出了Zen 4、Zen 4c两个版本,分别对应Genoa EPYC 9004系列、Bergamo EPYC 97x4系列两条产品线。
Zen 4、Zen 4c都基于完全相同的底层微架构,拥有完全相同的IPC性能、ISA指令集、技术特性,唯一的不同就是后者三级缓存更少一些,主频更低一些,同样的5nm工艺下核心面积缩小了大约35%之多。
对于操作系统和应用软件来说,不需要考虑二者的不同,也不需要专门的适配与优化,可一视同仁,只是将它们用在不同的负载和场景而已,其中Zen 4是常规的通用计算,Zen 4c则主攻高密度云计算。
第五代EPYC延续了这一理念,并进行了全面升级。
其中,Zen 5部分升级为4nm工艺,CCD模块从12个增至16个,整体从96核心192线程增至128核心256线程(每CCD还是8个),三级缓存也从384MB增至512MB(每核心还是4MB)。
Zen 5c部分更是升级为3nm工艺,使得核心面积进一步缩小,可以容纳更多核心,CCD模块从8个增至12个,整体从128核心256线程增至192核心384线程(每CCD还是16个),三级缓存则从256MB增至384MB(每核心还是2MB)。
AMD暂未公布Zen 5、Zen 5c的具体核心面积,但相信会和上代类似,至少也得差个1/3。
Intel走的则是"异构大小核",在至强历史上首次兵分两路,为此放弃了延续五代的"至强可扩展"的名号,改为更简单直接的"至强6"。
至强6 6000E系列代号Sierra Forest,首次将E核(能效核)引入数据中心,而且只有E核,专门针对高密度运算、可扩展负载。
至强6 6000P系列代号Granite Rapids,只使用传统的P核(性能核),主打高性能计算、AI负载场景。
它们都延续了以往的分离式模块化架构,其中核心计算模块升级为Intel 3制造工艺(可以粗略地认为大致等于3nm)。
至强6 E系列首发只有一种计算模块,144核心144线程——是的不支持超线程。
至强6 P系列则有四种计算模块配置:单个小模块16核心32线程、单个大模块48核心96线程、两个大模块96核心192线程、三个大模块128核心256线程(理论上应该是屏蔽了4个核心以保证良品率)。
至强6两条线的架构设计截然不同,规格、性能自然差异极大,不过还好,二者共享统一的软件开发平台,从而便于部署。
有趣的是,这是AMD EPYC诞生七年来,Intel第一次在核心数量上追平了AMD,当然只是说完整大核版本,都是128核心。
在"小核"方面,AMD仍然多出48个,还是高性能架构,还有超线程,还有更多……
【产品布局:128核心大战128核心、384线程大战288线程】
接下来,我们看看双方第一批新品的产品线布局,也是很有趣,同样走了截然不同的路线。
上一代EPYC将Zen 4、Zen 4c分成两条不同的子产品线,各有各的代号,命名规则都不一样,客户可以一眼看出区别。
这一次,EPYC 9005系列将Zen 5、Zen 5c纳入了统一管理,甚至共用一个代号Turin,就在型号命名上都完全混合在一起。
事实上这一代两种核心对应的内存、PCIe规格都完全一致,不像上代Zen 4c的精简了不少,自然没必要再区分开。
AMD也希望通过此举消弭Zen 5、Zen 5c之间的鸿沟,简化客户的选择,毕竟它们是同样的架构、性能、指令、功能,不需要差异对待。
客户根本不用考虑一款产品到底用了Zen 5还是Zen 5c,只需要根据自己的应用需求,选择不同的核心、频率、缓存、功耗等指标组合,即可找到最适合自己的型号。
非要区分的话,Zen 5的有22款,Zen 5c的有5款。
8-72个核心的只有Zen 5,144-192核心的只有Zen 5c,96-128核心的两种都有,其中9x55编号的为Zen 5,9x45编号的为Zen 5c。
另外值得一提的是,AMD首次将最高频率提升到了惊人的5GHz,对比上代的最高值一下子提升了足足600MHz。
这对于多核心的数据中心处理器来说是非常难得的,而且一次就有两款做到了,分别是16核心的EPYC 9175F、64核心的EPYC 9575F,非常适合对频率非常敏感的应用。
Intel则是分成了完全不同的两部分,分别冠以P、E的后缀,一眼就能看出谁是大核、谁是小核。
至强6900P系列都是大核,最高做到了128核心256线程,最少也有72核心144线程。
至强6700E系列最多144核心144线程,最少则是64核心64线程。
【规格性能:AMD气势如虹 全面碾压】
对比来看,五代EPYC 9005在纸面规格参数上就远胜于六代至强6,下边逐一对比下:
核心数:
EPYC 9005 Zen 5最多128核心256线程,与至强6900P持平。
Zen 5c的最多更是192核心384线程,遥遥领先至强6700E 144核心144线程。
另外,双方都支持最多双路并行,Intel这次也没有四路、八路。
频率:
EPYC 9005最高达到了空前的5.0GHz,Zen 5c最高也有3.7GHz。
至强6就差多了,甚至都没迈过4GHz的门槛,6900P最高统一都是3.9GHz,6700E系列更是只有3.2GHz。
三级缓存:
EPYC 9005 Zen 5、Zen 5c最多分别做到了512MB、384MB,平均每个核心分别4MB、2MB。
至强6900P最多504MB,只输了一点点;至强6700E则是最多108MB,还不到对手的三分之一,平均每个核心还不到1MB。
DDR5内存:
EPYC 9005系列全部统一支持12通道DDR5-6000,最低端也没有阉割。
至强6900P系列也是12通道,频率更高一些DDR5-6400,还支持新型MRDIMM内存,频率高达8800MHz——这几乎是至强6唯一的优势了。
至强6700E系列只有8个内存通道,而且只有部分型号保留DDR5-6400的频率,还有一部分降级为DDR5-5600。
PCIe 5.0通道:
EPYC 9005系列都是128条PCIe 5.0通道,和上代相同。
至强6900P系列只有96条,至强6700E系列进一步减少到88条。
热设计功耗:
双方最高都达到了500W,尤其是完整核心都是在128核心的情况下做到的,彼此彼此。
不过,Zen 5c 192核心时也有500W,至强6700E 144核心时则是330W,平均到每个核心后者更低一些为2.3W,前者是2.6W。
平台:
EPYC 9005系列延续了上代的SP5封装接口,客户可以无缝升级,而且按照AMD的做法,这一接口还会延续下去,可能要等到支持DDR6内存的时候才会改变。
至强6系列不但用了新接口,还分为两种,至强6900P系列是LGA7529,至强6700E系列是LGA4710,不仅上代无法升级,大小核之间也无法通用。
其他:
EPYC 9005系列全部支持AVX-512指令集,这本来是Intel的独门绝技,但异构大小核的设计让它消失了,至强6也没有。
EPYC 9005系列全部支持多线程,至强6900P也有,至强6700E就没了。
至强6内置了一系列的AI加速器,可以让某些特定负载大大加速,EPYC 9005系列则没有,不过AMD有更强大的Instinct加速卡,强调二者搭档发挥各自的优势,Intel GPU加速卡则没能做起来。
当然,纸面得来终觉浅,最终还要看跑分。
Phoronix网站进行了多型号的全方位测试,Ubuntu系统下跑了多达140个数据中心测试项目,总结如上。
可以看出,EPYC 9005系列对比至强6呈现一边倒的压倒性优势,可以说是全程吊打。
旗舰之争中,EPYC 9755面对MRDIMM-8000高频内存加持的至强6980P,双路、单路优势分别高达40.0%、18.4%,如果将后者换成普通的DDR5-6400,领先幅度更是能进一步提升到41.7%、19.3%。
夸张的是,只需要一颗EPYC 9755,就能干掉两颗搭配DDR5-6400内存的至强6980P!
同时,192核心的EPYC 9965、5GHz频率的EPYC 9575F,也都超越了至强6980P,后者领先超过20%。
有趣的是,EPYC的双路并行效率要高得多。
遗憾的是没有加入至强6700E系列的测试,但不但想象,即便加上也是被欺负的命。
功耗方面,五代EPYC也有着绝对优势,远远低于至强6。
无论是192核心的EPYC 9965,还是5GHz频率的EPYC 9575F,实际功耗都没有超过400W的热设计功耗指标。
即便是128核心旗舰的EPYC 9755,功耗也只有450W左右,远低于500W的热设计功耗。
至强6980P则正好达到了500W,这就是官方标称的热设计功耗。
【展望未来:只是刚刚开始 都还有杀手锏】
通过前述种种对比可是看出,EPYC 9005系列在至强6系列面前相当霸道,无论是规格参数、技术,还是实际性能、能效,又或者平台便利性,都实现了全方位的碾压,甚至可以说是吊打,Intel依然毫无还手之力。
而且,这只是双方新一代平台的开端,各自都还有杀手锏级的后招。
AMD没有透露具体情况,但显然会有适合极高性能计算的第三代3D缓存版本。
上一代就做到了768MB 3D缓存,加上原生的384MB合计达1152MB,也是史上第一次超过1GB。
这一代随着CCD模块数量的增加,3D缓存有望增至1024MB,加上原生的512MB,合计可达1536MB,也就是整整1.5GB!
Intel方面,明年一季度会发布至强 6900E系列,两个计算模块,最高达288核心288线程,在核心数量上创造新纪录。
但是因为不支持多线程技术,它的线程数还是稍逊一筹,再考虑到AMD多线程技术的效率,192核心384线程超过它问题不大。
另外还有至强6700P、6500P、6300P系列,显然核心数不会超过128个。
按照AMD的说法,EPYC平台已经拥有超过350个OEM平台、超过950个云实例,无论是大规模云厂商还是大型科技/行业企业,都有大量的深度合作伙伴,是实至名归的"超大规模数据中心第一处理器"。
Intel方面没有明确数据,但凭借长期以来雄厚的积累,以及依然把持住2/3的市场,合作案例肯定更多、更深入。
仅仅七年,AMD EPYC就吃下了超过1/3的市场,对于一向看重产品和平台品质、看重长期稳定性的服务器与数据中心客户来说,能做到这种程度只能说是一个奇迹。
更可怕的是,AMD EPYC在产品力上几乎找不到缺点和短板,几乎每一个点都让对手望尘莫及,相信还会拿到更多的市场。
七年五代产品,AMD将核心数量提升了6倍,性能更是提升了几乎11倍,一路狂奔根本停不下来的架势。
大家不妨猜一猜:AMD EPYC什么时候能占据50%的市场,平分秋色?
第五代 AMD EPYC 处理器将于 2024 年下半年上市
在Computex 2024上,AMD公司展示了下一代EPYC处理器——第五代AMD EPYC处理器(代号“Turin”),它将拥有卓越性能。 基于“Zen 5”核心的第五代处理器支持最多192个核心和384个线程,集成13个采用3nm和6nm工艺技术的小芯片。 它兼容所有最新内存和I/O标准,能直接替换现有第四代EPYC平台。 第五代AMD EPYC处理器将加强EPYC在通用和高性能计算任务上的优势。 在运行规格较小的大语言模型时,它在人工智能推理性能上表现突出。 预计第五代AMD EPYC处理器将在2024年下半年上市,为数据中心带来更卓越的性能和效率。 此款处理器一经亮相,已吸引了众多客户的关注和期待。
AMD EPYC(霄龙)9004系列热那亚处理器详细解读
AMD EPYC Genoa: 竞争激烈的服务器战场新势力
AMD的EPYC Genoa,以热那亚为代号,正在重塑服务器市场的格局,以50-60%的性能飞跃傲视群雄。 相较于Intel至强可扩展的1-2代,AMD凭借其Zen 4的创新CCD芯片和先进的I/O技术,实现了显著优势。 Genoa系列不再局限于单一设计,而是推出针对不同市场细分的解决方案,展示出AMD的多元化策略。
面对Arm的挑战,AMD以贝加莫新品作为回应,预计在2023年上半年发布,配备了惊人的128个内核。 Genoa-X系列将突破L3缓存限制,为高性能计算(HPC)应用提供海量缓存。 AMD Instinct MI300更是将x86和GPU融合,成为HPC领域的关键力量。 Zen 4架构带来14%的性能提升,AVX-512指令集得到强化,AI性能追赶的步伐也更为迅猛。
EPYC 9004 Genoa: Zen 4的新里程
第四代EPYC 9004系列升级至12个CCD,提供了8-12核和96/84核的灵活选择。 GMI3的改进连接了CCD,设计上支持4x/8x/12x的多样性。 Infinity Fabric提升至Gen5,为服务器间的通信提供前所未有的带宽。 无论是单路还是双路服务器,I/O和内存的配置都成为关键要素。
在160P服务器中,Genoa的2P XGMI技术实现了5倍PCIe Gen5通道的极致效率。 每颗CPU的128个x16通道中,64个专门服务于xGMI(包括PCIe Gen5)和CXL,其余用于低速接口。 新控制器优化了中断处理,而AMD的电源管理提供了自定义性能与功耗设置的可能性。 内存和CXL 1.1技术的提升同样引人注目。
Genoa采用DDR5-4800内存,12通道设计(比米兰增长50%),内存带宽大幅跃升,同时每个DIMM的成本和通道数增加,使得非二进制内存成本降低。 初期不支持2DPC和LRDIMM,但每核心内存带宽翻倍,适应于更大规模的96核处理器。 AMD的芯片分割技术与Intel的SNC4和UNC模式相媲美,CXL 1.1支持内存扩展,但限于Type 3内存缓冲。
CXL 1.1的潜力无限,它理论上为跨NUMA节点的内存扩展提供了可能。 Genoa的SKU阵容丰富多样,18个型号中有14个独特设计,包括4款单槽F SKU,注重频率优化,以及针对低核数和密度优化的SKU。 价格策略上,高端64核型号的频率提升显著,如9654和9634在保持123美元/核的同时,随着核心数增加,整体标价同步增长。 单插槽部件的价格涨幅明显,反映出AMD对性能提升和价值定位的坚定承诺。
AMD的这一代EPYC Genoa新品,不仅在性能和时钟速度上有了显著提升,还强调了单插槽服务器的潜力。 它在大规模1P系统中的表现不逊色于微软的设计,甚至与1P设计的24DIMM兼容,预示着单插槽服务器市场将迎来更大的发展空间。
Intel至强金牌U系列最大24核心是针对AMD哪些型号的反击?
Intel已规划推出新一代的至强金牌U系列处理器,旨在挑战AMD EPYC霄龙P系列单路产品,以应对市场上的差异化竞争。 单颗处理器将不再支持双路配置,仅提供单颗使用,瞄准的是单路和双路系统之间的性能与成本平衡点。
至强U系列首批型号包括三个选项,全部归类于Gold金牌系列,采用LGA3647封装,支持六通道DDR4-2933内存,最大容量可达1TB。 其中,最顶级的6212U型号具有24核心48线程,三级缓存35.75MB,频率区间为2.4-3.9GHz,预计售价约2000美元,热设计功耗165W。 而6210U和6209U则分别提供20核心40线程,频率和热设计功耗有所调整,价格分别在1500美元和1000美元左右。
相比之下,AMD的霄龙7551P拥有32核心64线程,频率为2-3GHz,三级缓存64MB,支持八通道DDR4-2666内存,热设计功耗180W,售价约2200美元。 而霄龙7401P则为24核心48线程,频率2.8-3GHz,热设计功耗155W,定价在1050美元左右。
从性能对比中,可以看出Intel至强U系列在单路性能上与AMD的霄龙P系列展开直接竞争,每款型号都针对不同应用场景提供了相应的性能和价格点。