【至顶实验室】我们在文中分析了Xeon Phi的起源以及与Xeon Scalable Processor/Skylake-SP的关系,Skylake-SP与Knights Landing的规格配置非常相似,实际上,Skylake-SP使用的Socket LGA3647插槽就来自于Knights Landing,我们认为,Xeon Phi最终会融入Xeon SP产品线,这将会大为扩展Xeon Scalable Processor的应用范围。不过,下一代Xeon Phi——Knights Hill应该要2018年才能发布。
Intel AVX-512 on Intel Skylake-SP:AVX-512-(F, VL, BW, DQ, CD)
我们还介绍了AVX-512指令集,Skylake-SP的AVX-512指令集来源于Xeon Phi/Knights Landing处理器。在使用AVX-512指令集编译的SPEC CPU2006代码进行测试后,得到的RATE成绩是整数/浮点为5000/3290,比AVX1高7.53%/2.8%。我们得到的结论是,AVX-512确实有效果,一些项目获得了巨大的提升,如Intel的传统强势项目462.libquantum的提升幅度就超过了144%,其实,这幅度有些过大了,显得有些灵异。
由于功耗发热的限制,性能更高的AVX-512指令也会发出更高的热量,导致所在的核心按照设计运行在较低的频率。笔者询问Intel的架构工程师,得到的恢复时间答案是“数毫秒”,这算是一个合理的数字。目前来看,应用用不用这个AVX-512特性还需要实际测试应用编译后的最终效果,这里存在一个性能功耗比的问题,未来我们可能还会继续调整优化AVX-512测试代码的编译。
下一篇文章我们将会开始最激动人心的部分:Skylake-SP的Mesh互联架构的深入分析,然后给出AVX 2.0编译的SPEC CPU2006测试成绩。
过往处理器评测:
2017年7月,Intel Xeon Scalable处理器初代,代号Skylake-SP:《Intel Skylake-SP处理器评测(一)》
2016年4月,Intel Xeon E5-2600 v4处理器,代号Broadwell-EP
好文章,需要你的鼓励
工业升级的关键,或许在于智能本身。“工业+机器人”将成为通向下一阶段工业体系的核心抓手。——黄仁勋。
浙江大学等联合研究发现,AI强化学习效果取决于"模型-任务对齐"程度。当AI擅长某任务时,单样本训练、错误奖励等非常规方法也有效;但面对陌生任务时,这些方法失效,只有标准训练有用。研究团队通过大量实验证实,这种"舒适圈"现象比数据污染更能解释训练差异,为AI训练策略优化提供了新思路。
瑞士政府正式发布了自主研发的人工智能模型,该模型完全基于公共数据进行训练。这一举措标志着瑞士在AI技术自主化方面迈出重要一步,旨在减少对外国AI技术的依赖,同时确保数据安全和隐私保护。该模型的推出体现了瑞士对发展本土AI能力的战略重视。
巴赫切希尔大学研究团队通过对五种不同规模YOLO模型的量化鲁棒性测试发现,静态INT8量化虽能带来1.5-3.3倍速度提升,但会显著降低模型对噪音等图像损伤的抵抗能力。他们提出的混合校准策略仅在大型模型处理噪音时有限改善,揭示了效率与鲁棒性平衡的复杂挑战。