全新微架构实力如何?Rocket Lake-S与Comet Lake-S同频率对比
Intel第11代酷睿处理器版Rocket Lake-S已经正式解禁并上市发售,虽然依旧延续了14nm制程工艺,但Rocket Lake-S相比前几代产品却有着翻天覆地的变化,最重要的就是Rocket Lake-S采用了全新的Cypress Cove内核微架构,相比于延续数代的Skylake微架构有着显著的IPC(同频性能)提升。
RocketLake-S诞生的背景
Intel在2014年(Tick年)底成功量产14nm制程工艺,推出Broadwell家族的酷睿M系列产品,而在2015年(Tock年),Intel则利用良率逐步走向成熟的14nm制程工艺将Skylake微架构的第6代酷睿全面推向市场;而当时的AMD还在泥潭中挣扎,推土机架构的FX系列面对Skylake,可以用 “高频低能、高功耗”来形容,是大火炉的代名词。
如果Intel能够持续延续Tick-Tock节奏,来推进路线图更新产品,那么Intel会在2016年(Tick年)量产10nm制程工艺的Cannon Lake(微架构继承Skylake),在2017年(Tock年)进行下一轮微架构升级,将Ice Lake(Sunny Cove)推向市场,在高性能处理器市场持续压制所有竞争对手……
不过在当时,或许没人能预测到原定计划服役2-3年的Skylake微架构会在桌面平台被使用长达5年之久,由于10nm制程工艺的种种问题,且Intel所遵循的“制程工艺与微架构相捆绑“原则,因此Intel迟迟不能将新架构的产品推向桌面市场,第7代酷睿Kaby Lake-S、第8-9代酷睿Coffee Lak-S、乃至第10代酷睿Comet Lake-S等一系列产品,虽然都有新的Code Name,但却全是Skylake微架构的衍生物,内核IPC没有变化,主要是依靠增加核心线程数量,以及拉高核心睿频来获得性能提升。
不可否认的是,纵观处理器发展历史,Skylake绝对是称得上成功的微架构设计,它的衍生物中也不乏酷睿i7-8700K、酷睿i9-9900K这样的经典产品,在2015-2019年为Intel获得市场领先地位立下巨大功劳;但英雄终有落幕之时,时间可以磨灭一切,面对竞争对手的持续进步,Intel也已经意识到Skylake微架构“廉颇老矣”,即使榨干14nm的超频潜力,也难以和采用新微架构设计的竞品相抗衡。因此基于此背景,Intel桌面平台处理器的微架构刻不容缓,代号为Rocket Lake-S的第11代酷睿处理器桌面版诞生了!
RocketLake-S全新的微架构与众多新特性
具体来看,Rocket Lake-S的核心部分采用了名为Cypress Cove的微架构,Cypress Cove微架构从前端规模、乱序缓冲区再到后端执行单元的设计均与Ice Lake-U采用的Sunny Cove微架构相同,因此相比延续已久的Skylake及其衍生物,Cypress Cove从微架构本身来看可称得上一次完整的换代。可以这么理解,Intel将原本基于10nm制程工艺设计Sunny Cove微架构backport“反向移植”到14nm制程工艺上,这就是Cypress Cove。
第11代酷睿处理器桌面版Rocket Lake-S采用LGA 1200插槽,与此前的Z490芯片组主板相兼容,当然除了内核微架构换新以外,Rocket Lake-S也带来了众多新特征:全新设计的Xe LP架构UHD核芯显卡,20条直连PCIe 4.0通道、全新设计的内存控制器(Gear1低延迟模式与Gear2极限高频模式)、3大AI深度学习加速引擎(AVX-512 VNNI、DP4A、GNA 2.0)、500系列芯片组、新的超频特性等。
前面提到过,除了制程工艺不同,Cypress Cove与Sunny Cove从微架构角度来看二者是高度相似的。而在2019年,面向轻薄本的第10代酷睿处理器Ice Lake-U发布时,Intel则对Sunny Cove微架构进行了详细的介绍,总结来说Sunny Cove对比Skylake,做到了更深的流水线、更大的乱序缓冲区、更多的后端执行单元,以及AVX-512指令集(AVX-512F CD、DQ、BW、VL)及其拓展(AVX-512 IFMA、VBMI、FMAPS、VNNI等)支持,是一次完整的架构迭代。
在官方PPT中,可以详细了解Intel从Haswell到Skylake再到Sunny Cove三大微架构的缓冲区及缓存设计异同;而对比Skylake,Sunny Cove微架构自然是做到了全面加强:一级数据缓存增大50%,达到每核心48KB;二级缓存翻倍,从每核心256KB增大到每核心512KB;μop微指令缓存增大50%,由1.5K指令数提高到2.25K指令数;乱序重排缓冲区ROB则增大大了57%,从224提高到352;访存Load/Store乱序缓冲区则从72+56提高到128+72。
而具体到微架构的同频性能也就是IPC,Intel在2019年发布第10代酷睿Ice Lake-U时表示,对比Skylake微架构,Sunny Cove实现了平均18%的IPC提升(测试应用包含SPEC CPU 2006、SPEC CPU 207、SYSmark 2014、WebXPRT、Cinebench R15等)。
而到了2021年,Intel发布第11代酷睿桌面版Rocket Lake-S时,官方表示Cypress Cove对比Skylake的IPC提升达到19%,测试项目为SPEC CPU 2017 Integer,并使用ICC编译器。
对于测试处理器微架构的IPC及提升幅度,变量其实不小,采用不同的测试平台(不同主板BIOS微码、不同内存频率和时序、不同缓存频率等),测试不同的应用项目,都会对测试结果有显著的影响。
而在此前的首测中,受限于时间关系,各大媒体大多只测试了Rocket Lake-S开箱即用的默频性能,大多没有进行单独的同频性能测试,而本次将对Rocket Lake-S与Comet Lake-S进行锁定频率对比测试,来看看全新的Cypress Cove微架构的改进……
测试平台介绍及注意事项
PConline使用酷睿i9-11900K对比酷睿i9-10900K,通过BIOS让酷睿i9-10900K保留8核心16线程(但三级缓存依旧为20MB,高于像酷睿i9-9900K、酷睿i7-10700K这样的标准8核心16线程Skylake微架构处理器),让它的规格和酷睿i9-11900K相同。二者的和核心频率均锁定为4GHz,Ringbus也就是缓存频率也锁定为4GHz。
内存方面为8GB×4,并将频率调整为DDR4-3600MHz,时序设置为CL16-18-18-38,酷睿i9-11900K在测试时通过BIOS调整为Gear1模式,保持内存控制器与内控频率为1:1不分频。
测试平台采用的主板为技嘉Z490 AORUS MASTER,并将BIOS更新至F20d版本,微码0x34,由于目前各主板厂商优先更新Z590芯片组主板的BIOS,Z490主板的BIOS更新较慢,无法使用最新的微码。而0x34这个版本的微码对内存控制器的优化还有些小问题,因此本次测试不包含搭配独立显卡的同频游戏测试。
CypressCove微架构同频性能提升约20%
本次测试包含众多项目,包括Cinebench R20、Cinebench R23、V-Ray 5 Benchmark、Geekbench 5、Blender 2.92、POV-Ray 3.7.1、CPU-Z、Sisoftware Sandra 2021、PCMark 10、3DMark等。未来将加入更多测试项目,并与AMD Zen 3微架构的锐龙5000系列桌面处理器Vermeer、Intel Willow Cove微架构的第11代酷睿处理器高性能移动版Tiger Lake-H45做更详细的同频性能对比。
Cinebench:
先来看一下常见的Cinebench,作为基于Cinema 4D开发的测试软件,Cinebench阴恻测试简单直观而广泛流行,目前已经跟随Cinema 4D一起更新至R23版本。但由于是基于单一软件应用场景的缘故,因此Cinebench并不能完全反应处理器的综合性能。
在R20版本中,基于Cypress Cove的酷睿i9-11900K同频单线程提高约17.1%,同频多线程提高约18.9%;在R23版本中,同频单线程提高约19%,同频多线程提高约18.9%,提升幅度基本一致。
Geekbench 5
Geekbench 5是目前流行的跨平台处理器性能测试软件,分为整数、浮点和加密三个子项目,在Geekbench 5中基于Cypress Cove的酷睿i9-11900K同频单线程提升极大,达到29.9%,同频多线程提升12.7%(或许是因为内存带宽瓶颈,导致支持AVX-512 VAES的加密子项目得分,无法做到随核心数量增加而线性提高)。
POV-Ray 3.7.1
POV-Ray,全名是Persistence of Vision Raytracer,是一个使用光线跟踪绘制三维图像的开放源代码免费软件,在GitHub上面下载3.7.1版本进行测试。基于Cypress Cove的酷睿i9-11900K同频单线程提升10.9%,同频多线程提升13.6%。
CPU-Z 1.95
CPU-Z同样是流行的基准测试软件,包含不同的项目以分别调用处理器的不同指令集运行。在V17测试中,基于Cypress Cove的酷睿i9-11900K同频单线程提升12.8%,同频多线程提升13.2%。
而在V19测试中,如果使用AVX2指令集,那么酷睿i9-11900K同频单线程提升20.6%,同频多线程提升16.9%;目前V19测试支持使用AVX-512指令集,因此Cypress Cove微架构可以进一步小幅挖掘性能,对比运行AVX2指令集的Skylake微架构,同频单线程提升21.4%,同频多线程提升19.7%。
V-Ray 5 Benchmark
V-Ray是由专业的渲染器开发公司CHAOSGROUP开发的渲染软件,是业界最受欢迎的渲染引擎。本次使用5.0.20版Benchmark进行测试,Cypress Cove微架构同频性能提升约17.9%。
Blender 2.92
在实际渲染方面,使用Blender进行测试。Blender 是一款开源的跨平台全能三维动画制作软件,提供从建模、动画、材质、渲染、到音频处理、视频剪辑等一系列动画短片制作解决方案,目前最新版本为2.92。分别导入victor、pavillon_barcelona、koro、classroom、bwm27等素材进行渲染,并对比时间。
从结果中可以发现,Cypress Cove微架构的酷睿i9-11900K渲染koro素材效率提升极大,同频提升超过40,而渲染另外四个素材也可以做到同频提升15%左右。
y-cruncher
目前已经有一些软件能够较好的利用AVX-512指令集及其拓展字迹,例如计算圆周率的专业软件y-cruncher(支持AVX-512 IFMA)。计算1,00,000,000位圆周率时,Cypress Cove微架构同频单线程性能提升极为恐怖,达到了79.3%,充分展现出了AVX-512 IFMA的威力!
不过在计算1,000,000,000位圆周率时,Cypress Cove微架构同频多线程提升只有17.7%,相比单线程的恐怖提升衰减明显,这也证明了目前在运行某些需求密集型计算时,双通道DDR4-3600CL16-18-18-38内存已经成为了瓶颈。
SiSoftware Sandra 2021
SiSoftware Sandra中文版是一个十分强大的系统分析评测工具,包含众多基准测试,目前最新版本为2021。
其中算数处理器项目,Cypress Cove微架构同频性能提升极小,只有2.9%。但在支持AVX-512指令集及子集拓展的多媒体处理器项目中,Cypress Cove微架构的性能没有令人失望,同频提升为40.2%。
PCMark 10
PCMark 10 含有一整套全面的测试项,涵盖现代办公场所中的各种任务,是被广泛认可的计算机综合性能测试软件(除了处理器以外,内存、显卡、固态硬盘性能也会影响PCMark 10分数)。在标准的基准测试中,基于Cypress Cove微架构的酷睿i9-11900K平台提升约6.5%,相比老架构没有拉开实质性差距,或许对于轻量级的任务来说,处理器已经不是主要性能瓶颈。
不过在运行Microsoft Office+Edge的PCMark应用程序测试中,基于Cypress Cove微架构的酷睿i9-11900K平台提升达到了10.2%。
3DMark
使用3DMark对处理器进行测试, Cypress Cove微架构在Fire Strike项目中的同频提升约11.6%,Time Spy项目同频提升约11.4%
而支持指令集更全面的Time Spy Extreme测试中,如果使用SSE3指令集,Cypress Cove对比Skylake同频提升为12.5%;而使用AVX2指令集,Cypress Cove对比Skylake同频性能提升15.3%;使用AVXFMA,Cypress Cove对比Skylake同频性能提升约14%;当然使用AVX-512后Cypress Cove微架构还可以进一步挖掘性能,且提升显著,对比只能以AVX2指令集运行该项目的Skylake同频提升42.2%。
本次测试项目的数据汇总:总结
- 标签:根号6等于多少
- 编辑:茶博士
- 相关文章