除了整数运算和浮点运算的差别之外,SPEC CPU2006测试还分两种:SPEED测试和RATE测试,SPEED测试类型运行单个实例,用来测试系统运行单作业的时候的运算能力,RATE测试则是运行多个实例,用来测试系统的总运算吞吐能力。SPEC CPU测试还会给出两种类型的结果:Base基准测试结果和Peak峰值测试结果,Base测试要求编译器套件按照指定的规则进行优化,而Peak测试则可以允许使用更多地优化技术,可以看出,前者可以用来简单对比不同的平台,而后者则在对比因素中加入了编译器等因素,有实力编写编译器的厂商可以从中获益。本页给出的是SPEED测试结果,按照整数到浮点、Base测试到Peak测试排列四个成绩图标,每个图表给出了测试系统及对比系统的每个子项目的成绩。图表图例文字中最后的"2S12C24T"字段指的是2 Sockets、12 Cores、24 Threads,意思是“2插槽12核心24线程”。
我们先进行了SPEED测试,特别指出的是,在2个或者1个核心满负荷的时候,由于Intel Turbo Boost睿频技术的作用,Intel Xeon E5-2697 v2将运行在3.5GHz(基频2.7GHz),DELL PowerEdge R730xd样机配的Intel Xeon E5-2620 v3将运行在3.2GHz(基频2.4GHz),运行频率有300MHz的差距:
SPECint_base2006,整数,SPEED测试,Base基准测试
由于462.libquantum 物理:量子计算在SPEED测试当中也可以分散到多个线程进行处理,因此这一项的得分异常地高,导致其它项目显得比较低。让人惊奇的是,双路12的DELL PowerEdge R730xd在单任务运行速度上可以和上一代的旗舰——双路Xeon E5-2697 v2相媲美。
SPECint2006,整数,SPEED测试,Peak峰值测试
和SPECint_base2006的状况类似。
SPECfp_base2006,浮点,SPEED测试,Base基准测试
在浮点方面,新平台的单任务速度略低于老一代的旗舰配置。
SPECfp2006,浮点,SPEED测试,Peak峰值测试
同上。
好文章,需要你的鼓励
在迪拜Gitex 2025大会上,阿联酋成为全球AI领导者的雄心备受关注。微软正帮助该地区组织从AI实验阶段转向实际应用,通过三重方法提供AI助手、协同AI代理和AI战略顾问。微软已在阿联酋大举投资数据中心,去年培训了10万名政府员工,计划到2027年培训100万学习者。阿联酋任命了全球首位AI部长,各部门都配备了首席AI官。微软与政府机构和企业合作,在公民服务和金融流程等领域实现AI的实际应用,构建全面的AI生态系统。
Google DeepMind最新研究发现,视频生成AI模型Veo 3展现出惊人的零样本学习能力,能够在未经专门训练的情况下完成图像分割、边缘检测、迷宫求解等多种视觉任务。研究团队通过18,384个视频样本验证了这一发现,认为视频模型正朝着通用视觉智能方向发展,可能引发类似大语言模型的行业变革。
苹果与俄亥俄州立大学研究人员发布名为FS-DFM的新模型,采用少步离散流匹配技术,仅需8轮快速优化即可生成完整长文本,效果媲美需要上千步骤的扩散模型。该模型通过三步训练法:处理不同优化预算、使用教师模型指导、调整迭代机制来实现突破。测试显示,参数量仅1.7亿至17亿的FS-DFM变体在困惑度和熵值指标上均优于70-80亿参数的大型扩散模型。
北航团队开发的GeoSVR技术突破了传统3D重建方法的局限,采用稀疏体素表示和体素不确定性评估,无需依赖初始点云即可实现高精度表面重建。该方法通过智能的深度约束和体素协同优化策略,在DTU等标准数据集上取得了最佳性能,为VR/AR、文物保护、影视制作等领域提供了新的技术选择。