intel服务器CPU的走向
   来源:无节操的DrBT     2020年09月27日 23:32

intel发布Xeon SP后,有一个思考过挺长时间的问题终于给了官方的数据:AVX模式下会降频。

XEON SP非AVX模式下的主频就是默认主频,TC频率相当可以,旗舰产品Platinium 8180全核可以做到 3.2G,提升0.7,GOLD系列12核以上产品也大致是这个提升幅度,比起上一代产品有一定提升:

请忽略核心这个参数,intel纯粹是按照LCC,HCC,XCC的最大值写的,2699V4,22核,2.2G主频,全核TC 2.8,提升0.6;2697V4,18核 2.3G主频,全核2.7,TC 3.0都是0.6G提升,相比之下,同为18核的Gold 6154,主频3.0全核3.7,幅度上不大,但整体提升达到1G,比较夸张。

如果只有这点,就不足以成文了,关键是 SP有下文,intel终于公开了AVX 2.0和AVX 512下的主频:

双256 FMA的AVX 2.0下,Platinium 8180的主频从2.5降到了2.1,TC幅度仍然为0.7,全核落在了2.8,跟上一代的2699V4同频,

TMAX降低0.2为3.6 。6154也终于守不住3.7G,掉到了全核3.3,双核降幅稍小,落在3.6G。倒是8核的6144主频直接从3.5掉到2.8,TMAX从4.2掉到3.6,全核4.1掉到3.5,跟12核旗舰6146都是AVX 2.0的跌幅记录。

再来看新特性AVX512,简直惨不忍睹,8180主频已经跌破2G来到1.7,全核只剩2.3,相比AVX 2.0,主频掉0.4,全核掉0.5,TMAX掉0.1;两个跌幅领先的6144和6146这次主频分别只有2.2和2.1,再掉0.6和0.5,全核 变成2.8和2.7,跌幅继续高达0.7和0.6。

结论:现代CPU的SIMD效率越高,功耗就越惊人,或者说,SIMD才是现代CPU的功率密度最核心的部分,各种扩展指令集以及超线程技术,都是为最大限度利用而推出的。然而我们的TDP的定义并不是按照所有ALU/FPU一起满载运行计算出来的,正常情况下,都是ALU/FPU在等数据,等待比例越高,效率越低,功耗也就越低,相反,AVX512模式下,数据等待时间被大幅压缩,效率上去了,功耗不涨只能说你打下了飞碟。

这就是过去一直思考的问题的答案,高并行高效率=高功耗,要维持TDP,降频可能是唯一途径。

理论上AVX 512性能达到AVX 2.0的两倍,主频从2.1降低到1.7,不算亏,但一想到2倍其实距离蛮大的,总是严重不爽嘛。

intel表示,资源2倍,没说实际跑是两倍哦。

混蛋,intel这不是欺骗么?确实有很多忽悠人的地方,但也符合常识。

8176之流其实更惨,主频只有1.3,全核1.9

T系列是长寿命版,属于新概念,照掉不误,没有例外

单AVX512版本如何呢?照跌不误,而且因为TDP低得厉害,导致TC跟主频跌得比双AVX512版XEON更惨,41166直接从2.1/2.4跌到1.1/1.4,3104这类连TC都不支持的产品干脆AVX512就只能跑800Mhz,这年头GPU都不跑这么低了。

好了,说这么多要表达什么意思呢?

意思很简单嘛,intel在被选中后必须要拿得出符合要求的产品来

在今年6月的TOP500榜单中出现了当时还没有发布的Xeon Platinium 8160F,从成绩上看,似乎相当给力,148716个核心,也就是6174个CPU的运算能力已经跟3356个 KNL 7250互戳几百回合,并且在能效上压过一头(4.52 vs 3.89),这是CPU跟加速卡正面对决中非常好的成绩了,排名第十一的E5V4平台上241920个核心(18核,共13440个E5-2695V4)的能效只有1.94,这是AVX 2.0的结果。

intel的答案就是把Skylake跟KNL融合,于是SKL-SP在AVX512模式下,几乎成了向量机,也难怪能效可以跟加速卡有拼了,当然这只是跟上一代的KNL和Kepler比,相比Pascal差距还是有的,没办法,Nvidia也是被选中的嘛。

目前的情况跟十一年前是相反的,intel得背上HPC的重任,所以HEDT / SERVER自带了过于强悍的SIMD设计,功耗上吃亏也不是什么奇怪的事,跑无关应用又占不到便宜,成本还不低。SKL-SP为了解决L3大改+降频(mesh频率应该是2.4G)的副作用,把L2加大到了1M,目前测试看下来,1M似乎不足以填平差距,游戏经常干不过6950X不能说没有L3废掉的影响,所以,可能下一代(应该2019年出)HEDT/SERVER会利用10nm工艺再次加大L2,反正10的性能跟14+差不多,Intel故意不拿14++做SKL-SP。。。。

SKL-SP的出现进一步拉大了桌面/移动跟服务器产品线的差距,给玩家带来了很多的麻烦,暂时HEDT除了I/O优势外就没什么亮点了,同样的问题出现在AMD平台,TR测试也都看到了,除了I/O以外并没有太多吸引桌面玩家的因素,所以双方在HEDT的交火更像神仙打架,intel把HCC下放的意图大致如此,不指望HEDT能有啥拓展,只求纸面领先。

桌面平台就很常规了,CFL继续保持KBL架构设计,依靠更强悍的工艺终于把6核推上高频,主频3.7不是问题,7900X主频才3.3还不照样能获得7700K级别的单核新能,不需要AVX512的SIMD设计可以简单得多,烧鸡功耗也要低得多,我们得到了实惠,但实质我们离真正的高性能越来越远了。

主频 下一代 功耗