虚拟化已经成为现代IT当中一种基础技术,在前面我们已经提过Core核内的SMAP技术。在Uncore上,提供的还要多一些,Broadwell-EP上,更新的有三个部分:
1.Posted Interrupts,邮站中断/中转中断
2.Page Modification Logging,页面修改记录
3.VM Enter/Exit latency Reduction,虚拟机进入/退出延迟降低
其中,每一代Intel的处理器都在虚拟机切换(VM Enter/Exit)性能上有所增强,上一代Haswell的Roundtrip Time是约500个时钟周期,Broadwell降低到了约400个时钟周期,降低了20%:
遗憾的是,笔者提问是否有Enter/Exit单独的数据时,回答是没有,问这个问题的用意是嵌套虚拟化,Enter/Exit并不一定非要成对出现。嵌套虚拟化目前在商业应用上已经有了一些苗头。
Haswell上带来的面向嵌套虚拟化的改进特性,被称之为VMCS Shadowing,通过允许客户VMM直接访问VMCS Shadowing Structure来降低VM entry/exit
Posted Interrupts,邮站中断或者中转中断,翻译 by 盘骏/Lucifer
邮站中断是笔者的翻译,其实笔者并不清楚其有没有中文,邮站中断的意思是,在Broadwell-EP之前,外部设备发送到虚拟机的中断会导致大量的VM Exits,因为虚拟机无法直接访问硬件,需要VMM进行中转;在Ivy Bridge-EP上,Intel加入了APICv特性,用硬件在虚拟机内部实现了一部分APIC功能,从而降低了虚拟机VM Exit的次数,APICv仅实现了中断的一部分,仍有很多中断会导致VM Exit,因此,Posted Interrupt进一步地,在虚拟机内部实现了硬件处理其余中断的结构,它有些类似邮站,外部中断直接投递进Posted Interrupt硬件,完全避开了VMM的处理,这种思想和很多的Kernal Bypass技术一样,其收益也非常明显,特别是在配合SR-IOV的情况下。目前,Xen/KVM Hypervisor已经支持Posted Interrupt。根据其工作方式,称之为中转中断也不错。
Page Modification Logging,页面修改记录
PML是用于VM FT(fault tolerance,容错)的技术,其基于Haswell EPT A/D实现,通过记录页面修改来降低生成Chekpoint检查点的消耗,提高性能。
Haswell EPT A/D:EPT Access/Dirty Bits,EPT(Extended Page Tables)是管理虚拟机内存地址到物理内存地址转换的硬件机制
笔者对VM FT的应用比较少,因此不再多言。接下来我们看看Broadwell-EP Uncore的其他改进。
好文章,需要你的鼓励
三星与AI搜索引擎Perplexity合作,将其应用引入智能电视。2025年三星电视用户可立即使用,2024和2023年款设备将通过系统更新获得支持。用户可通过打字或语音提问,Perplexity还为用户提供12个月免费Pro订阅。尽管面临版权争议,这一合作仍引发关注。
浙江大学团队提出动态专家搜索方法,让AI能根据不同问题灵活调整内部专家配置。该方法在数学、编程等任务上显著提升推理准确率,且不增加计算成本。研究发现不同类型问题偏爱不同专家配置,为AI推理优化开辟新路径。
苹果M5 MacBook Pro评测显示这是一次相对较小的升级。最大变化是M5芯片,CPU性能比M4提升约9%,多核性能比M4 MacBook Air快19%,GPU性能提升37%。功耗可能有所增加但电池续航保持24小时。评测者认为该产品不适合M4用户升级,但对使用older型号用户仍是强有力选择。
清华大学研究团队提出SIRI方法,通过"压缩-扩张"交替训练策略,成功解决了大型推理模型"话多且准确率低"的问题。实验显示,该方法在数学竞赛题上将模型准确率提升43.2%的同时,输出长度减少46.9%,真正实现了效率与性能的双重优化,为AI模型训练提供了新思路。