【ZD至顶网】2016年10月27日至29日,SPEC(Standard Performance Evaluation Corporation,标准性能评估组织)将于北京举办SPEC 2016亚洲峰会,这也是SPEC组织自1988年成立以来首次在中国举办的峰会。
SPEC组织是什么?SPEC 2016亚洲峰会又有什么目的?为了最好地回答这些问题,ZD至顶网作为SPEC 2016亚洲峰会的协办方对SPEC组织主席Walter Bays进行了专访。
Walter Bays 是SPEC董事会成员,现任SPEC主席。Walter在1989年加入SPEC组织,先后是SPEC组织中CPU、NFS、SPEC Power、SPEC web server等基准测试的开发者,并率先开发了业界首个Java测试基准。Walter毕业于德州大学,专注性能工程和容量规划领域超过30年。目前,Walter是Oracle平台与战略应用工程事业部的首席软件工程师。
Walter Bays:SPEC是一个非营利性的第三方组织,旨在制定、修改以及认证一系列计算系统应用性能评估的标准。SPEC的这些基准测试以及性能指标可以广泛适用并真实反映出客户的实际计算环境,基于测试基准,用户可以对比不同的硬件及软件,供应商可以利用基准测试提升真实环境的硬件性能。我们这次大会的目的是给中国用户介绍SPEC组织和我们的测试方法,并期待听一听中国市场对基准测试的相关需求。
Walter Bays:SPEC组织具有来自于30个国家的120个成员,包括硬件及软件生产商、大学、研究机构。包括可以从spec.org网站获取免费性能报告的所有计算机系统用户,也包括可以运行自己测试的许可用户,研究基准测试相关性能指标的研究人员。
Walter Bays:亚洲,特别是中国,已经成为全球IT企业级市场增速最快,规模第二大的市场,增长速度远高于全球平均水平。我们需要到中国来与业界和学术界的计算机专家会面,向他们介绍SPEC组织,听取他们的意见,建立一个长期的合作关系。我们的成员中有不少是中国的企业以及学术研究机构。我们希望更多的中国乃至亚洲的客户了解到SPEC组织和我们的基准测试,可以吸引到更多的亚洲成员加入,更好的发挥出SPEC基准测试报告对中国用户的借鉴作用。
Walter Bays:在本次大会的部分议题中,将对SPEC基准测试可以给用户提供什么样的技术指导进行详尽介绍。在这里只想强调一下,最简单的一种方式就是对比基准测试的成绩,也就是对比指标。譬如,A系统要比B系统快20%。或者也可以更仔细的看你关心的一些参数,例如RU数或者价格,综合对比后,可能发现系统C会更好。你也可以将某些子指标设置为0从而定制最接近你的环境,你也许会发现,在你的环境中系统B比A和C都要好。
Walter Bays:云计算的兴起,客户需要知道哪些云具有更好的性能、更好的弹性以及更少的故障,并允许快速地伸缩。SPEC将在此次会议上发布全球第一个云计算基准测试:SPEC Cloud IaaS 2016,可以满足上面这些需求。它量化了云的伸缩性、弹性、实例平均配置时间以及错误率。SPEC Research Group同样活跃于云基准测试,分享“弹性”的定义以及一些云计算和大数据相关的基准测试研究方向。
Walter Bays:更进一步,SPEC会将SPEC Cloud IaaS 2016及其它SPEC基准测试作为一个云服务来提供,为云计算中的对象和文档存储、事件驱动系统建立标准的基准测试(也就是将SPEC的产品包装为云服务)。SPEC组织已经邀请一些中国代表用户参与这项工作,这些举措都将有助于云计算和大数据的落地。
Walter Bays:计算机工业在飞速的发展(编者按:云计算、大数据、人工智能等)。我们的挑战是开发出着眼于用户今天乃至明天的基准测试与指标体系。因此我们必须观察市场如何发展,收集信息,并鼓励全球用户的广泛参与。寻找这些愿意帮助我们了解未来市场需求的参与者,这就是我们来中国的理由之一。
了解首届SPEC 亚洲峰会更多信息,请关注http://www.zdnet.com.cn/spec/2016
好文章,需要你的鼓励
在“PEC 2025 AI创新者大会暨第二届提示工程峰会”上,一场以“AIGC创作新范式——双脑智能时代:心智驱动的生产力变革”为主题的分论坛,成为现场最具张力的对话空间。
人民大学团队开发了Search-o1框架,让AI在推理时能像侦探一样边查资料边思考。系统通过检测不确定性词汇自动触发搜索,并用知识精炼模块从海量资料中提取关键信息无缝融入推理过程。在博士级科学问题测试中,该系统整体准确率达63.6%,在物理和生物领域甚至超越人类专家水平,为AI推理能力带来突破性提升。
Linux Mint团队计划加快发布周期,在未来几个月推出两个新版本。LMDE 7代号"Gigi"基于Debian 13开发,将包含libAdapta库以支持Gtk4应用的主题功能。新版本将停止提供32位版本支持。同时Cinnamon桌面的Wayland支持持续改进,在菜单、状态小程序和键盘输入处理方面表现更佳,有望成为完整支持Wayland的重要桌面环境之一。
Anthropic研究团队开发的REINFORCE++算法通过采用全局优势标准化解决了AI训练中的"过度拟合"问题。该算法摒弃了传统PPO方法中昂贵的价值网络组件,用统一评价标准替代针对单个问题的局部基准,有效避免了"奖励破解"现象。实验显示,REINFORCE++在处理新问题时表现更稳定,特别是在长文本推理和工具集成场景中展现出优异的泛化能力,为开发更实用可靠的AI系统提供了新思路。