前面有所提及,Haswell搭载了强大的指令集更新,甚至用了Haswell New Instruction的词语来形容:
Haswell New Instruction,Haswell新指令集
AVX2,或者AVX 2.0,其改进首先是将AVX 1.0未涉及的整数SIMD提升到与浮点SIMD一致的宽度:256位,翻倍的处理宽度让整数SIMD性能大为提升,如多媒体处理、高性能计算等应用都能从中获益。AVX2还加入了FMA(Fused Multiply-Add,融合乘加)的支持,对图形应用程序员来说,FMA指令不会陌生,它可以显著提升相关浮点处理的性能。AVX2.0中的FMA属于三操作数的FMA3,AVX2.0也加入了一些离散的整数相关指令。
双倍的FMA单元和双倍的缓存带宽:
最后是专门用来提升程序同步性能的指令集,限于时间关系,不详细介绍:
TSX:Transactional Synchronization Extensions,事务同步扩展
和核心架构的改进不同,指令集的增强需要程序使用新的指令集进行编译。不过,256位整数AVX运算以及FMA的实现让人对AVX2的性能很是期待。
好文章,需要你的鼓励
万码科技创始人周媛告诉记者,当前企业对于数字人才的需求非常旺盛,而万码优才聚焦于数字技术人才的求职和职业发展平台。
虽然几乎每个行业的组织都公开披露了他们使用生成式AI产生可衡量效益的例子,但是未来他们可能就不会那么坦诚了。
西班牙家居用品制造商Persán在欧洲拥有三家工厂,多年前就开始转型,目标是转向一种更具活力的模式,能够在任何地点进行生产。