除了整数运算和浮点运算的差别之外,SPEC CPU2006测试还分两种:SPEED测试和RATE测试,SPEED测试类型运行单个实例,用来测试系统运行单作业的时候的运算能力,RATE测试则是运行多个实例,用来测试系统的总运算吞吐能力。SPEC CPU测试还会给出两种类型的结果:Base基准测试结果和Peak峰值测试结果,Base测试要求编译器套件按照指定的规则进行优化,而Peak测试则可以允许使用更多地优化技术,可以看出,前者可以用来简单对比不同的平台,而后者则在对比因素中加入了编译器等因素,有实力编写编译器的厂商可以从中获益。本页给出的是SPEED测试结果,按照整数到浮点、Base测试到Peak测试排列四个成绩图标,每个图表给出了测试系统及对比系统的每个子项目的成绩。图表图例文字中最后的"2S12C24T"字段指的是2 Sockets、12 Cores、24 Threads,意思是“2插槽12核心24线程”。
SPEED测试关注的是快慢为主,而RATE测试关注的是计算吞吐量,这也是一般服务器应用关注的指标。RATE测试会导致机器处于满负荷运转状态,所有核心的占用率也会达到100%。由于Intel Turbo Boost睿频技术的作用,在所有核心满负荷的时候,Intel Xeon E5-2697 v2将运行在3.0Hz(基频2.7GHz),DELL PowerEdge R630样机配的Intel Xeon E5-2620 v3将运行在2.7GHz(基频2.4GHz):
SPECint_rate_base2006,整数,RATE测试,Base基准测试
采用Haswell-EP的戴尔PowerEdge R630在SPEED测试上可以和Ivy Bridge-EP旗舰型号相媲美,但在RATE测试中确实有所不如,因为顶级Ivy Bridge-EP平台的CPU核心数量整整比Haswell-EP平台多了一倍。
SPECint_rate2006,整数,RATE测试,Peak峰值测试
峰值性能仅供参考。
SPECfp_rate_base2006,浮点,RATE测试,Base基准测试
浮点吞吐量上Haswell-EP平台表现比较好,在AVX2指令集的作用下,PowerEdge R630/Xeon E5-2620 v3平台具有Xeon E5-2697 v2平台约72.0%的浮点性能。
SPECfp_rate2006,浮点,RATE测试,Peak峰值测试
仅供参考。
好文章,需要你的鼓励
在迪拜Gitex 2025大会上,阿联酋成为全球AI领导者的雄心备受关注。微软正帮助该地区组织从AI实验阶段转向实际应用,通过三重方法提供AI助手、协同AI代理和AI战略顾问。微软已在阿联酋大举投资数据中心,去年培训了10万名政府员工,计划到2027年培训100万学习者。阿联酋任命了全球首位AI部长,各部门都配备了首席AI官。微软与政府机构和企业合作,在公民服务和金融流程等领域实现AI的实际应用,构建全面的AI生态系统。
北航团队开发的GeoSVR技术突破了传统3D重建方法的局限,采用稀疏体素表示和体素不确定性评估,无需依赖初始点云即可实现高精度表面重建。该方法通过智能的深度约束和体素协同优化策略,在DTU等标准数据集上取得了最佳性能,为VR/AR、文物保护、影视制作等领域提供了新的技术选择。
苹果与俄亥俄州立大学研究人员发布名为FS-DFM的新模型,采用少步离散流匹配技术,仅需8轮快速优化即可生成完整长文本,效果媲美需要上千步骤的扩散模型。该模型通过三步训练法:处理不同优化预算、使用教师模型指导、调整迭代机制来实现突破。测试显示,参数量仅1.7亿至17亿的FS-DFM变体在困惑度和熵值指标上均优于70-80亿参数的大型扩散模型。
Google DeepMind团队发布了EmbeddingGemma,这是一个仅有3.08亿参数的轻量级文本理解模型,却能达到7亿参数模型的性能水平。该模型在权威的多语言文本嵌入基准测试中排名第一,支持250多种语言,特别适合移动设备部署。研究团队通过创新的编码器-解码器初始化、三重损失函数训练和模型融合技术,实现了性能与效率的完美平衡,为AI技术普及化开辟了新路径。