【ZD Research】测试中我们为了对比四代处理器,使用了略旧Intel C&Fortran Compiler版本,因此对Broadwell-EP不足够友好。在使用AVX 1.0编译代码时,Intel Xeon E5-2699 v4比Intel Xeon E5-2699 v3提升28.5%(整数)和23.4%(浮点),在使用AVX 2.0编译代码时,Broadwell-EP性能是Haswell-EP的225%(整数)和176%(浮点),性能优势是很明显的。以后我们会使用更新版本的Intel C&Fortran Compiler进行编译。
2016年4月,Intel Broadwell-EP处理器评测 by ZD Research 盘骏/Lucifer
性能的提升部分基于核心数量的提升,基于14nm工艺,Broadwell-EP在TDP基本不变的情况下将核心数量提升最多4个。除了核心数量的变化之外,Broadwell-EP在微架构/架构方面的改进让前面的AVX 2.0性能测试具有不正常的提升,虽然其幅度不值得信任,但其也代表了这些微架构/架构改进确实可能起到作用。
Intel Xeon E5-2600 v4最多可以提供22个核心
除了性能的提升之外,一个我们很看重的特性是Intel RDT(Resource Director Technology,资源管理技术),通过RDT,系统管理员可以更精细的管理CPU上具有的资源,从Cache到代码优先级到内存带宽,都可以管理。而在以往,X86很缺乏这些能力。参考Intel VT技术,永久改变了X86虚拟化的实现,现在RDT也具有类似的潜力。
Intel Resource Director Technology
Broadwell-EP的改进有很多,由于时间关系未能尽兴,请继续期待我们的相关评测文章。
前两代处理器Ivy Bridge-EP和Haswell-EP的评测:
好文章,需要你的鼓励
Salesforce研究团队发布开源工具包MCPEval,基于模型上下文协议(MCP)架构评估AI智能体工具使用性能。该工具突破传统静态测试局限,通过全自动化流程收集详细任务轨迹和协议交互数据,为智能体行为提供前所未有的可视化分析。MCPEval能快速评估MCP工具和服务器,生成综合评估报告,为企业智能体部署提供可操作的改进建议。
清华大学团队推出AnyCap项目,通过轻量级"即插即用"框架解决多模态AI字幕生成缺乏个性化控制的问题。该项目包含模型、数据集和评估基准,能让现有AI系统根据用户需求生成定制化字幕,在不重训基础模型的情况下显著提升控制能力,为AI内容创作的个性化发展奠定基础。
月之暗面Kimi K2技术报告:解读万亿参数的智能体模型(含K2与DeepSeek R1对比)
耶鲁大学团队开发了全球首个AI科学实验设计评估系统ABGEN,测试了18个先进AI模型设计消融实验的能力。研究发现最好的AI系统得分4.11分,仍低于人类专家的4.80分,但在人机协作模式下表现显著改善。研究还发现现有自动评估系统可靠性不足,建立了元评估基准ABGEN-EVAL。这项研究为AI在科学研究中的应用提供了重要评估框架。