除了整数运算和浮点运算的差别之外,SPEC CPU2006测试还分两种:SPEED测试和RATE测试,SPEED测试类型运行单个实例,用来测试系统运行单作业的时候的运算能力,RATE测试则是运行多个实例,用来测试系统的总运算吞吐能力。SPEC CPU测试还会给出两种类型的结果:Base基准测试结果和Peak峰值测试结果,Base测试要求编译器套件按照指定的规则进行优化,而Peak测试则可以允许使用更多地优化技术,可以看出,前者可以用来简单对比不同的平台,而后者则在对比因素中加入了编译器等因素,有实力编写编译器的厂商可以从中获益。本页给出的是RATE测试结果,按照整数到浮点、Base测试到Peak测试排列四个成绩图标,每个图表给出了测试系统及对比系统的每个子项目的成绩。图表图例文字中最后的"2S36C72T"字段指的是2 Sockets、36 Cores、72 Threads,意思是“2插槽36核心72线程”。
SPEED测试关注的是延迟为主,而RATE测试关注的是吞吐量,这也是一般服务器应用关注的指标。需要注意的是,在所有核心满负荷的时候,Intel Xeon E5-2699 v3工作在2.8GHz,Intel Xeon E5-2697 v2工作在3.0GHz:
SPECint_rate_base2006,整数,RATE测试,Base基准测试
462.libquantum的成绩终于不再如前面的那样突兀,其单项提升是35.2%,总性能提升是37.1%。462.libquantum是一个内存密集型的测试,L1带宽的提升也很有影响,这是SPEED测试性能提升明显的原因之一,不过,在多实例的情况下,L3 Cache和内存带宽限制了Haswell强大的Load/Store能力的发挥。
SPECint_rate2006,整数,RATE测试,Peak峰值测试
仅供参考。
SPECfp_rate_base2006,浮点,RATE测试,Base基准测试
浮点运算的提升仍然比整数低一点,为30.0%。
SPECfp_rate2006,浮点,RATE测试,Peak峰值测试
仅供参考。
好文章,需要你的鼓励
思科与英伟达、VAST Data合作推出安全AI工厂,整合服务器、GPU和存储设备为企业提供一体化AI基础设施。该方案采用融合基础设施形式,以AI POD作为核心组件,搭载英伟达RTX PRO 6000 Blackwell GPU和思科UCS服务器。存储方面支持NetApp、Pure Storage或VAST Data产品。VAST声称其InsightEngine能够加速RAG管道,将响应延迟从分钟级降至秒级,支持企业级智能体AI应用。
浙江大学等联合研究发现,AI强化学习效果取决于"模型-任务对齐"程度。当AI擅长某任务时,单样本训练、错误奖励等非常规方法也有效;但面对陌生任务时,这些方法失效,只有标准训练有用。研究团队通过大量实验证实,这种"舒适圈"现象比数据污染更能解释训练差异,为AI训练策略优化提供了新思路。
随着人工智能深度融入商业文化,97%的高管认为生成式AI将改变其公司和行业。然而,当人们越来越依赖AI处理记忆、推理和创造性任务时,认知外包现象悄然兴起。研究表明,数字依赖正在重塑记忆模式,可能削弱问题解决能力和批判性思维。组织需要在效率与能力保持之间找到平衡,通过认知训练、批判性参与等方式,将AI视为增强工具而非替代品。
巴赫切希尔大学研究团队通过对五种不同规模YOLO模型的量化鲁棒性测试发现,静态INT8量化虽能带来1.5-3.3倍速度提升,但会显著降低模型对噪音等图像损伤的抵抗能力。他们提出的混合校准策略仅在大型模型处理噪音时有限改善,揭示了效率与鲁棒性平衡的复杂挑战。