Intel Skylake-SP处理器评测（二）原创

作者：盘骏/Lucifer

AVX-512将SIMD宽度从256位增加到了512位。

　　AVX-512是典型的SIMD（Single Instruction Multiple Data，单指令多数据）指令集，它可以认为是256位的AVX 2.0的扩展，SIMD宽度达到了512位。AVX（Advanced Vector Extensions，高级矢量扩展）当中的Vector矢量（也就是向量）一词就已经标明了其为一个SIMD指令集。矢量化，或者说向量化，是提升数据处理能力的一个重要手段。

AVX-512 - KNL and future Xeon：是的，一切早有预谋

　　我们先来看AVX-512要求的根本性架构改变：

SSE->AVX-2->AVX-512，16xXMM->16xYMM->32xZMM，笔者担心的是，未来的AVX-1024的寄存器该叫什么？

　　如果你了解过AVX 1.0（通常简略为AVX或AVX1）和AVX 2.0（AVX2或AVX-2），那么AVX-512也很好理解：数据处理宽度翻倍，在硬件上，它需要将处理器的AVX寄存器的宽度和数量都进行翻倍。新的AVX-512指令集将使用被称为ZMM0-31的32个512位寄存器，其中，16个就是原有的AVX 2.0使用的256位YMM寄存器加宽，然后新增加了16个新的512位寄存器。需要特别注明的是，新增加的寄存器必须运行在64位模式才能进行存取。

Intel AVX-512 on Intel Skylake-SP：AVX-512-(F, VL, BW, DQ, CD)

　　说到寄存器必须说到的是，在Skylake-SP的微架构设计当中，使用的是寄存器重命名，实际上是将操作数当中的寄存器重定位到寄存器当中的某些寄存器上，这种虚拟的对应可以消除大量的寄存器move操作——只需要建立新的指向即可。因此，AVX-512指令集要求的32个ZMM寄存器，实际上没有必要反映出来，当然，寄存器的宽度最好实装，如下图所示，实际增加了12个整数寄存器，浮点寄存器并没有变化，就这样支持了AVX-512指令集。

Intel Skylake-SP Core Microarchitecture：增加了12个整数寄存器

　　这12个整数寄存器可能包含了8个64位的mask寄存器，这些寄存器用来精细控制SIMD指令执行的对象，披露，只对512位总长数据中的某几个数据进行操作，而掠过某几个其他的数据。Skylake-SP的AVX-512还内置了广播和取整功能，在以往，使用什么规格的浮点取整方式是全局设定的，现在，每一条指令都可以设置自己的取整方式，这可以让指令的执行变得更为灵活。

　　AVX-512当中最让人迷惑的可能就是其包含的众多子集合了，Intel Skylake-SP搭载的是AVX-512-(F, VL, BW, CD)：

　　F指Foundation，基础。AVX-512F就是基础的AVX-512指令集，为MIC与Xeon当中通用的部分（到了未来，就变成Xeon SP的基础部分了）。CD则是Conflict Detection，冲突检测，类似的机制在Core微架构的MOB（Memory Ordering Buffer）复合体中存在，实质上是以地址冲突检测搭配机遇性执行来充分发掘指令的执行度（上图中说的是向量化循环）。ER和PR则是Exponential指数操作和Prefetch预取操作，前者还包含了倒数操作（或者说，以-1为幂的指数），这两个指令集扩展不受SKL-SP支持而存在于KNL当中。

　　DQ这是Double and Quad word指令——双字/四字指令，包含了AVX-512F当中不具备的所有packed 32位/64位操作。BW这是Byte and Word指令，字节/字指令，将packed指令扩展到字节和字（8位和16位），如此一次性可以处理64个/32个数据。这个指令集也给出了MMX/SSE2/AVX2指令对应的AVX-512原语。VL这是Vector Length扩展——向量长度扩展，它的含义是，AVX-512指令集也可以对128位或者256位数据进行处理。

　　接下来可能是比较少为人知的几个新指令集：

　　请允许我们暂时忽略其他，只介绍最后一个：XSAVE{S,C}，它用来保存扩展的处理器状态，包括AVX-512指令集在内，需要新的XSAVE指令集支持，以在线程切换的时候，保存/恢复这些新寄存器的数据。

　　关于AVX-512暂时介绍到这里，接下来我们将会展开对其进行的测试。

来源：至顶网CBSi企业方案解决中心频道

0赞

好文章，需要你的鼓励

Intel Skylake-SP处理器评测（二） 原创

来源：至顶网CBSi企业方案解决中心频道

2017

07/13

11:51

分享

点赞

瑞士巴塞尔大学研发微型口腔牙科机器人可自动钻牙

我如何整理散落在网络各处的数千张照片和视频

极端高温考验电网，电动校车"反向充电"成救星

OpenAI拟向美国政府出让股权，科技巨头争相布局AI云服务

恒帅股份美国汽车微电机工厂投产，1500万美元基地承接39.34%境外收入

阿里云百炼推出Agentic RAG服务，让AI的知识检索和回答更精准

聚焦全球化增长赛道， Unity 再度登陆 2026 ChinaJoy BTOB

5060 Ti 16GB 跑本地 AI，真不如加钱买二手 3090？

家用储能电池如何在飓风与极端高温中支撑电网稳定运行

散热为什么成了AI算力的“阀门”？

亚马逊 Mechanical Turk 将停止接受新用户注册

量子力学百年演进：从费解理论到改变世界的技术基石

英特尔携手火山引擎：奔赴产业实景，让AI落地实处

中国LineShine超算登顶全球最快超级计算机榜首

NVIDIA发布AI科学软件，加速材料模拟与天文探索

Nvidia发布Vera Rubin平台，聚焦AI与高性能计算基础设施

戴尔发布基于英伟达Vera Rubin GPU的AI服务器

一台轻薄本走进纳西村：英特尔如何重新定义AI PC移动体验？

验证能力将决定HPC与AI融合的未来走向

英特尔锐炫Pro B70 GPU亮相MPTS2026，共探大视听时代AI创作新范式

英特尔陈立武：Agentic AI时代，如何再造一个英特尔？

英特尔至强6+，为数据中心带来了什么？

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

Intel Skylake-SP处理器评测（二）原创