为什么Rocket Lake-S在Geekbench 5中提升极大?新架构性能如何判断?
2020年末的台式机DIY市场无比精彩,AMD Zen 3微架构如期上市,发布了代号为Vermeer的锐龙5000系列处理器,带来了高达19%的平均IPC同频性能提升,让桌面处理器的生产力和游戏性能达到了新高度!自从2017年AMD发布初代锐龙起,历经5年共4代产品,微架构从Zen/Zen+进化到Zen 2再进化到Zen 3,总IPC提升幅度约40%,完成了对Intel Skylake微架构的赶超。
而说到高性能处理器,Intel则是永远绕不开的话题,作为全球年营业额最大的半导体公司,Intel曾经的领先优势无与伦比!在2014年底成功量产14nm制程工艺Broadwell-Y后,Intel在2015年利用良率逐步走向成熟的14nm制程工艺将Skylake微架构产品(第6代酷睿)全面推向市场,此时AMD还在泥潭中挣扎,推土机架构的FX系列面对Skylake简直就是“高频低能多核低能且高功耗”的大火炉,几乎一无是处。
但是英雄终有落幕之时,时间可以磨灭一切。如果Intel一切顺利,能按照此前正确的Tick-Tock节奏来推进路线图更新产品,那么Intel会将在2016年量产10nm制程工艺的Cannon Lake(微架构继承Skylake,工艺制程换代),在2017年则进行下一轮微架构升级,将Ice Lake(Sunny Cove)推向市场,在高性能处理器市场继续维持对AMD及ARM的压制。
可惜由于10nm制程工艺的种种问题,Intel迟迟不能将新架构的产品推向桌面市场,本该在2017年退役的Skylake架构在桌面平台沿用了5年之久,而AMD则在5年期间顺利执行路线图,更新了4代产品;最终结果就是:Skylake微架构的马甲衍生物(Kaby Lake/Coffee Lake/Comet Lake等)在2017-2018年全面领先Zen/Zen+架构的第一代第二代锐龙,在2019-2020年上半年凭借高频率在游戏中压制Zen 2,但到了2020年底,面对IPC在Zen 2基础上继续提高19%的Zen 3架构已经无能为力......
Skylake从2015年全面碾压推土机,到2019年与Zen 2打的难分难解,再到2020年底则自己变成为“高频低能高功耗”,逆水行舟不进则退的故事又一次上演。
第11代酷睿Rocket Lake-S采用的架构是什么?
面对AMD Zen 3,Intel显然已经意识到了Skylake已经廉颇老矣,再靠官方极限灰烬超频也无能为力,无论如何新架构都必须尽快上市了!如果10nm制程工艺还是不行,那就解绑微架构与制程工艺,先用14nm制程工艺来做!基于此背景,代号为Rocket Lake-S的第11代酷睿处理器桌面版诞生了!
前文中提到过。Intel虽然受制于10nm制程工艺的产能、良率、频率等问题,没有将新架构推向桌面端;但在移动端,Intel在2019年推出了第10代酷睿处理器Ice Lake-U,虽然代号还叫XX Lake,但微架构升级为Sunny Cove,带来了显著的IPC提升;而到了2020年,Intel则推出面向轻薄本的第11代酷睿处理器Tiger Lake-UP3,采用的Willow Cove微架构则在Sunny Cove的基础上继续小幅增强,增大了L2及L3缓存、并提升安全性。
至于第11代酷睿桌面处理器Rocket Lake-S,官方曾在新闻稿中说明它与移动端Ice Lake和Tiger Lake有很深的关系;虽然还是14nm制程工艺,但Rocket Lake-S的内在变化极大,可以说是脱胎换骨。其中核显部分抛弃了祖传好几代的UHD 630、更新为和Tiger Lake相同的Xe架构;而处理器部分则彻底抛弃Skylake,采用了全新设计的Cypress Cove,官方表示全新的架构可带来多达两位数的IPC提升。
换句话说,Rocket Lake-S可以当作是14nm制程工艺的Ice Lake-S,Cypress Cove则是Sunny Cove移植到14nm制程工艺的产物,除了频率以外,架构本身高度趋同。
在2019年Ice Lake发布时,Intel曾对Sunny Cove微架构进行了详细的介绍,总结来说Sunny Cove对比Skylake,做到了更深的流水线、更大的缓冲区、以及更多的执行单元,当然还有例如AVX-512指令集及其拓展等新特性加成,是一次完整的架构迭代。
Haswell、Skylake、Ice Lake(Sunny Cove)三大微架构特性对比:
最终intel官方表示,Sunny Cove对比Skylake在通用计算中可获得18%的平均IPC性能提升,而在一些专用计算中提升会更大。而之前提到过,Rocket Lake-S所采用的Cypress Cove与Sunny Cove二者在设计方面高度趋同,Rocket Lake-S在采用成熟14nm制程工艺的后,可以同时满足高频率和高IPC,单核性能方面可获得很大提升。
Geekbench 5性能测试成绩分析
根据可靠消息,Intel将在2021年1月的CES 2021展会上发布,距离正式上市越来越近,目前已经有一些关于Rocket Lake-S的性能测试泄露出来。
前两天的一颗酷睿i7-11700K的测试成绩被上传到Geekbench5数据库中,单核测试成绩为1813分(后台数据查询为默认睿频5.0GHz),可谓非常亮眼,超过了Zen 3架构的锐龙9 5950X默频成绩,也成功将苹果M1和A14等ARM处理器斩落马下。
网页截图:
后台链接:https://browser.geekbench.com/v5/cpu/5572561.gb5
在这个跑分泄露出后,立刻引发了媒体们的广泛报道和玩家们热烈讨论,在距离Rocket Lake-S产品正式发布还有不到一个月的情况下,笔者将对这个测试成绩进行简单分析,由于是QS版的睿频未必稳定、且内存频率/时序对Geekbench 5成绩影响极大,因此本次分析仅供参考。
Geekbench 5是一个知名度跨平台性能测试软件,此前在苹果IOS设备及Android手机中被广泛使用,几乎是手机平板等ARM设备的性能测试标杆;随着近些年ARM架构电脑越来越多,尤其是苹果M1的Mac系列产品在实际应用中的出色表现(对得起超高的Geekbench 5跑分),Geekbench 5也逐渐被部分DIY爱好者所接受,成为了处理器性能测试中的一项参考项目。不过为了避免额外的争议,本次分析仅限X86平台处理器内部对比,参与对比的处理器包含一颗默认睿频5GHz的酷睿i9-9900K(Skylake微架构)、以及PBO开启后单核睿频可达5GHz的锐龙7 5800X(Zen 3微架构)。
Geekbench 5是一项综合性测试,包含三个大项目(Crypto 加密解密、Integer 整数、Floating Point 浮点)。其中Crypto 加密解密主要测试AES-XTS性能,调用处理器的AES、SHA以及AVX2 Vector AES、AVX-512 Vector AES等指令集,占总分权重较低,为5%。
Integer 整数项目则包含了数个子项目,分别为Text Compression 文本压缩、Image Compression 图像压缩、Navigation 导航、HTML5 网页、SQLite 数据库、PDF Rendering、Text Rendering、Clang 编译、Camera等,占总分权重65%;Floating Point 浮点测试中的子项目更多,包含N-Body Physics N体模拟、Rigid Body Physics 刚体模拟、Gaussian Blur 高斯模糊、Face Detection 人脸识别、Horizon Detection 视界检测、Image Inpainting 图像修复、HDR 高动态范围图像、Ray Tracing 光线追踪、Structure from Motion 三维重建、Speech Recognition 语音识别、Machine Learning 机器学习,占总分权重30%。
如果从测试覆盖类型上来看,Geekbench 5包含的工作负载非常广,由于软件免费,且测试需要的技术门槛低,因此Geekbench 5 Integer 整数测试和Floating Point 浮点测试,在手机圈甚至充当着“平民版”的SPEC CPU 2006的来使用。
而回到本次流出的酷睿i7-11700K,在Geekbench 5.3.1版本下,对比Skylake微架构的酷睿i9-9900K(单核约1400分),在5GHz同频下领先接近30%!而对比PBO开启单核睿频5GHz的AMD锐龙7 5800X,同频性能也小有优势。
在前文中我们提到过,Sunny Cove对比Skylake的微架构IPC平均幅度为18%,而在Geekbench 5.31单核测试中,与Sunny Cove设计趋同的Cypress Cove却得到了接近30%的IPC提升,远远超过平均值,这背后的原因又是什么呢?
具体来看测试项目及成绩,以Skylake微架构的酷睿i9-9900K 5GHz为基准,如果是常规的Integer 整数测试和Floating Point 浮点测试,Cypress Cove对比Skylake分别提高17.1%和17.5%,与官方宣传的新架构IPC平均提高18%数值非常接近,关键在于Crypto 加密解密测试,Cypress Cove同频达到了Skylake的3倍以上;在Integer 整数测试和Floating Point 浮点测试IPC已经增长超过15%的前提下,即使Crypto 加密解密测试项目占总分权重极小,但考虑到Cypress Cove优势实在太大,因此而将三个项目结合加权后,Cypress Cove的在Geekbench 5.31中IPC呈现了爆发式增长。
而如果用Zen 3对比Skylake,Geekbench 5.3.1 IPC领先25%以上,Integer 整数测试和Floating Point 浮点测试分别领先13.8%和25%,Crypto 加密解密领先幅度同样接近2.5倍。跨越一个级别的IPC差距,已经不是Skylake靠鸡血超频能够让性能追上的,何况Zen 3的产品频率普遍不低。
让双方最新微架构相对比,Integer 整数测试Cypress Cove小幅领先Zen 3约2.95%,Floating Point 浮点Zen 3领先Cypress Cove约6.4%,Crypto 加密解密则是Cypress Cove领先Zen 3约28.8%。
再来看具体的子项目,占60%权重的Integer 整数测试中,两个新架构整体同频性能差距不大,其中Cypress Cove同频赢了6项、Zen 3赢了5项,Cypress Cove略占优势,Skylake则一项没赢。
而占30%分数权重的Floating Point 浮点测试,Zen 3同频整体领先Cypress Cove约6.4%,可以获胜的子项目也明显更多,这可能是因为Geekbench 5的Floating Point 浮点测试子项目对AVX-512指令集的支持比较一般,在都运行AVX2负载的情况下,Zen 3后端分离度高的特性,导致了在很多子项下有更大优势。
Crypto 加密解密部分,由于Skylake架构不支持SHA,AES执行单元仅有Zen 2一半,更不支持AVX2 Vector AES或AVX-512 Vector AES等新指令加速,所以测试成绩极度拉跨,Zen 3和Cypress Cove凭借新指令级加持都可以在此项目中碾压Skylake,而二者直接对比,AVX2 Vector AES对决半吞吐AVX-512 Vector AES,Cypress Cove道高一尺魔高一丈,同频效率更高一筹。
但考虑到在Integer 整数测试和Floating Point 浮点测试中Cypress Cove和Zen 3差距不大,Crypto 加密解密仅占总分的5%权重,所以两个新架构的Geekbench 5综合IPC并没有因此拉开太大差距。
总结与展望
如果从Geekbench 5测试成绩入手分析,那么显然Cypress Cove的IPC提升是符合预期的,即使抛开AVX-512 Vector AES指令加速的Crypto 加密解密项目,只看较为常规、更贴近玩家日常应用的Integer 整数测试和Floating Point 浮点测试,Cypress Cove对比老旧的Skylake依旧可以提高了15-20%综合IPC。而与Zen 3架构对比,Cypress Cove也能做到总体上IPC相当,劣势项目已经相差不大、还有一些优势突出的项目。当然更全面的性能测试,还需要等待产品正式发售后评测解禁。
得益于内核微架构改进以带来的IPC提升,笔者预测第11代Rocket Lake-S上市后将一定程度上缓解Intel桌面市场的竞争压力。但是Rocket Lake-S显然不会是完美无缺的一代产品,它的短板也将比较明显,用低密度14nm制程工艺来做新一代微架构,势必会带来功耗飙升以及核心面积上涨,最直观的问题就是Rocket Lake-S规格最高仅有8核心16线程,因此酷睿i9-11900K面对12核心乃至16核心的Zen 3势必压力极大,只能选取游戏性能作为突破口,甚至也会面临同规格小弟酷睿i7-11700K的背刺......当然,主流价位的第11代酷睿i7和酷睿i5系列更值得期待,面对AMD锐龙5锐龙7核心数量并不落后,在IPC相当的情况下,凭借更高的频率应该能带来综合性能和游戏帧数优势。
最后发出一点感概,如果Intel前些年能继续顺利进行原有的Tick-Tock乃至PAO模式,那么“正统路线图”中10nm制程工艺的Ice Lake-S/Tiger Lake-S会带着Sunny Cove/Willow Cove在2017-2019年登录桌面端,面对Zen 2乃至Zen 3都能游刃有余,当然这也是假设罢了......Rocket Lake-S这样的工艺架构解绑毕竟只是权宜之计,还是希望Intel在未来能够顺利执行路线图,让产品的制程工艺更新与微架构换代重回正轨,带来性能与能耗比全面提升的产品,或许是Alder Lake?
- 标签:罗马柱多少钱一根
- 编辑:茶博士
- 相关文章