【至顶网实验室】上次我们说到,Intel(英特尔)的处理器已经从Tick-Tock钟摆策略转变为“Process-Architecture-Optimization”——“制程-架构-优化”策略。Tick-Tock策略大约是每两年更换一次工艺制程(Tick)、每两年更新一次微架构(Tock),最终就是每年换一次制程或微架构,从而每年都能有新产品推出。尽管“Process-Architecture-Optimization”策略也是大约一年一次新产品,但工艺制程和微架构刷新的时间从原有的两年变成了三年,从而适应越来越接近10nm带来的难度,这个策略从Broadwell-Skylake-Kaby Lake开始,下一个循环将是Cannon Lake-Ice Lake-Tiger Lake。以下图片如非特别注明,均来自Intel。

从“Tick-Tock”变为“Process-Architecture-Optimization”,笔者将其称为“Tick-Tock-Tock”(非官方)
显然,“Tick-Tock-Tock”策略的前两个和之前一样,都是“Tick-Tock”,因此这个策略对于Broadwell和Skylake来说无甚作用,不过,这并不意味着Skylake不重要,实际上,对服务器处理器来说,新一代Skylake极为重要,可谓是Intel的一个大招,重要到处理器的命名方式都改变了。

2017年7月12日,全新一代的Intel Xeon Scalable Processor——可扩展至强处理器,以后简称为Xeon Scalable处理器
新一代Skylake服务器处理器的完整代号为“Skylake-SP”,缩写为“SKL-SP”,而上一代Broadwell服务器处理器的完整代号为“Broadwell-EP”,缩写为“BDW-EP”,虽然两代处理器后缀都带有一个“P”,但它们的含义不同,前者后缀全称是“Scalable Processor”,后者后缀全称是“Efficency Performance”。顺便一提,和“EP”对应的“EX”、“EN”、“E”的全称分别是“Expandable”和“Entry”、“Extreme”,EX就是Xeon E7-8800,EN就是Xeon E5-2400,E的话,就是桌面的Core i9-7900X。
2017-07-14勘误:E是以前由对应Xeon的某个型号改头换面的Core i7至尊版酷睿的代号后缀,Skylake的对应版本已经更改为X后缀——Skylake-X,对应地,Core命名的系列名变成了i9。
从Skylake-SP开始,Xeon Scalable处理器家族不再使用之前的Xeon E5/E7 v1/v2/v3/v4命名方式,而是变成了“金属”加数字命名,如上图所示,新一代处理器家族分为四个等级,分别为“Platinum”(铂/白金)、Gold(金/黄金)、Silver(银/白银)、Bronze(青铜),这总有点让人想到各式圣衣……有趣的是,各种金属的“色彩”是真实存在的,上图中就可以看出,Bronze确实用的是“红色”,这个色彩辨识方式也体现在了包装盒子上:

在Portland的Intel秘密会议上拍到的四种色彩处理器盒子,Bronze是黄中偏红,原因见下一页。来源:盘骏/Lucifer
虽然笔者很怀疑服务器处理器的包装盒有多少人能看到,不过无论如何,这次新的命名方式的四种层次是显而易见的,不难区分。难点在于处理器层次所对应的应用方向。显而易见的是,Xeon Bronze对应的是入门级应用,大致有些像之前的Xeon E5-2400,而Xeon Silver则大致对应于之前的Xeon E5-2600,它们均只能搭建双路平台;Xeon Gold与Xeon Platinum则可以搭建多路服务器,其中Xeon Gold限制为四路,大致相当于Xeon E7-4600,Xeon Platinum大致相当于Xeon E7-8800,当然,Scalable——可扩展——的真正含义尚未凸显,接下来我们就会首先介绍一下,然后开始对Skylake-SP的架构与微架构进行一个Deep Dive深入分析,最后是一部分已经完成的评测内容,更多的内容需要留待更后面的文章——因为时间总是不够用,整个平台的更新实在太多了。

2017年7月,Intel Xeon Scalable处理器初代,代号Skylake-SP by 盘骏/Lucifer
Skylake前三代处理器的评测:

2016年4月,Intel Xeon E5-2600 v4处理器,代号Broadwell-EP
好文章,需要你的鼓励
Lumen Technologies对美国网络的数据中心和云连接进行重大升级,在16个高连接城市的70多个第三方数据中心提供高达400Gbps以太网和IP服务。该光纤网络支持客户按需开通服务,几分钟内完成带宽配置,最高可扩展至400Gbps且按使用量付费。升级后的网络能够轻松连接数据中心和云接入点,扩展企业应用,并应对AI和数据密集型需求波动。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
RtBrick研究警告,运营商面临AI和流媒体服务带宽需求"压倒性"风险。调查显示87%运营商预期客户将要求更高宽带速度,但81%承认现有架构无法应对下一波AI和流媒体流量。84%反映客户期望已超越网络能力。尽管91%愿意投资分解式网络,95%计划五年内部署,但仅2%正在实施。主要障碍包括领导层缺乏决策支持、运营转型复杂性和专业技能短缺。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。