除了整数运算和浮点运算的差别之外,SPEC CPU2006测试还分两种:SPEED测试和RATE测试,SPEED测试类型运行单个实例,用来测试系统运行单作业的时候的运算能力,RATE测试则是运行多个实例,用来测试系统的总运算吞吐能力。SPEC CPU测试还会给出两种类型的结果:Base基准测试结果和Peak峰值测试结果,Base测试要求编译器套件按照指定的规则进行优化,而Peak测试则可以允许使用更多地优化技术,可以看出,前者可以用来简单对比不同的平台,而后者则在对比因素中加入了编译器等因素,有实力编写编译器的厂商可以从中获益。本页给出的是SPEED测试结果,按照整数到浮点、Base测试到Peak测试排列四个成绩图标,每个图表给出了测试系统及对比系统的每个子项目的成绩。图表图例文字中最后的"2S12C24T"字段指的是2 Sockets、12 Cores、24 Threads,意思是“2插槽12核心24线程”。
我们先进行了SPEED测试,特别指出的是,在2个或者1个核心满负荷的时候,由于Intel Turbo Boost睿频技术的作用,Intel Xeon E5-2697 v2将运行在3.5GHz(基频2.7GHz),DELL PowerEdge R630样机配的Intel Xeon E5-2620 v3将运行在3.2GHz(基频2.4GHz),运行频率有300MHz的差距:
SPECint_base2006,整数,SPEED测试,Base基准测试
众所周知,由于462.libquantum 物理:量子计算在SPEED测试当中可以分散到多个硬件线程进行处理,因此这一项的得分异常地高,导致其它项目显得比较低。双路DELL PowerEdge R630在单任务运行速度上可以和上一代的旗舰——双路Xeon E5-2697 v2相媲美。
SPECint2006,整数,SPEED测试,Peak峰值测试
和SPECint_base2006的状况类似。
SPECfp_base2006,浮点,SPEED测试,Base基准测试
在浮点方面,新平台的单任务速度略低于老一代的旗舰配置。
SPECfp2006,浮点,SPEED测试,Peak峰值测试
同上。
好文章,需要你的鼓励
OpenAI和微软宣布签署一项非约束性谅解备忘录,修订双方合作关系。随着两家公司在AI市场竞争客户并寻求新的基础设施合作伙伴,其关系日趋复杂。该协议涉及OpenAI从非营利组织向营利实体的重组计划,需要微软这一最大投资者的批准。双方表示将积极制定最终合同条款,共同致力于为所有人提供最佳AI工具。
中山大学团队针对OpenAI O1等长思考推理模型存在的"长度不和谐"问题,提出了O1-Pruner优化方法。该方法通过长度-和谐奖励机制和强化学习训练,成功将模型推理长度缩短30-40%,同时保持甚至提升准确率,显著降低了推理时间和计算成本,为高效AI推理提供了新的解决方案。
中国科技企业发布了名为R1的人形机器人,直接对标特斯拉的Optimus机器人产品。这款新型机器人代表了中国在人工智能和机器人技术领域的最新突破,展现出与国际巨头竞争的实力。R1机器人的推出标志着全球人形机器人市场竞争进一步加剧。
上海AI实验室研究团队深入调查了12种先进视觉语言模型在自动驾驶场景中的真实表现,发现这些AI系统经常在缺乏真实视觉理解的情况下生成看似合理的驾驶解释。通过DriveBench测试平台的全面评估,研究揭示了现有评估方法的重大缺陷,并为开发更可靠的AI驾驶系统提供了重要指导。