实际上,我们为测试机器试验了两种操作系统:一种是Debian GNU/Linux 9.3.0 Stretch x64,并搭载了其时最新的Linux Kernel 4.14.6-041406-lowlatency #201712140930 x64内核,但它略微有些不太稳定;第二种是SuSE Linux Enterprise Server 12 SP3 x64(简称SLES12 SP3),基于SUSE当时最新的Linux Kernel 4.4.92-6.30-default x64内核,提供了非常稳定的体验,但内核并没有那么新,最终我们发现它们的性能各有千秋。我们给出的是SLES12 SP3下的数据。
H3C UniServer R4700 G3测试平台与测试环境
测试平台基于双路Intel Xeon SP Gold 6142处理器,主频2.6GHz,最高可以Turbo到3.7GHz(但运行AVX2代码的时候会降低一些),Gold 6142核心数量为16,硬件线程32,整台双路机器就具有32个核心和64个线程。Gold 6142提供了3个10.4GT/s的UPI界面,提供了很高的性能,内存方面,H3C UniServer R4700 G3总共提供24个DDR4 DIMM,合12个内存通道,H3C为我们配置了12条16GiB的SK. Hynix R-ECC DDR4-2666内存以最大化内存性能。H3C UniServer R4700 G3搭载的是Intel Lewisburg C622芯片组,不过它和本文测试的计算性能基本上没有关联,同理,存储子系统也没有产生什么影响。但关于它们还有不少值得称道的地方,我们计划在后面的文章中进行介绍。
好文章,需要你的鼓励
在迪拜Gitex 2025大会上,阿联酋成为全球AI领导者的雄心备受关注。微软正帮助该地区组织从AI实验阶段转向实际应用,通过三重方法提供AI助手、协同AI代理和AI战略顾问。微软已在阿联酋大举投资数据中心,去年培训了10万名政府员工,计划到2027年培训100万学习者。阿联酋任命了全球首位AI部长,各部门都配备了首席AI官。微软与政府机构和企业合作,在公民服务和金融流程等领域实现AI的实际应用,构建全面的AI生态系统。
北航团队开发的GeoSVR技术突破了传统3D重建方法的局限,采用稀疏体素表示和体素不确定性评估,无需依赖初始点云即可实现高精度表面重建。该方法通过智能的深度约束和体素协同优化策略,在DTU等标准数据集上取得了最佳性能,为VR/AR、文物保护、影视制作等领域提供了新的技术选择。
苹果与俄亥俄州立大学研究人员发布名为FS-DFM的新模型,采用少步离散流匹配技术,仅需8轮快速优化即可生成完整长文本,效果媲美需要上千步骤的扩散模型。该模型通过三步训练法:处理不同优化预算、使用教师模型指导、调整迭代机制来实现突破。测试显示,参数量仅1.7亿至17亿的FS-DFM变体在困惑度和熵值指标上均优于70-80亿参数的大型扩散模型。
Google DeepMind团队发布了EmbeddingGemma,这是一个仅有3.08亿参数的轻量级文本理解模型,却能达到7亿参数模型的性能水平。该模型在权威的多语言文本嵌入基准测试中排名第一,支持250多种语言,特别适合移动设备部署。研究团队通过创新的编码器-解码器初始化、三重损失函数训练和模型融合技术,实现了性能与效率的完美平衡,为AI技术普及化开辟了新路径。