除了前面比较成体系的改进之外,Broadwell的Uncore还有一些杂项提升:
1.Opportunistic Snoop Broadcast,机遇性侦听广播
2.Hardware Controlled Power Management,硬件控制电源管理
3.Intel Processor Trace,Intel处理器追踪
4.DDR4 Write CRC,DDR4写CRC
5.ECRC(End to End CRC Protection) for PCIe IO Subsystems,PCIe IO子系统端到端CRC
杂项改进中笔者最关注的是Hardware Controlled Power Management
其中DDR4写CRC和PCIe IO子系统端到端CRC用来提升内存子系统和PCIe IO子系统的鲁棒性,进一步提升X86系统的可靠性。
这里还给出了不同模式下Broadwell-EP的内存读取延迟和带宽
Hardware Controlled Power Management,缩写是HWPM而不是HCPM,则是笔者最关注部分:
为什么觉得HWPM重要?因为在HWPM之前,CPU的工作状态(C0~C6)是由操作系统控制,一方面,工作有延迟,不能及时反映负载变化,Turbo频率也不够迅速,另一方面,操作系统的软件实现也给系统带来一些负载。遗憾的是,经过测试,这个特性暂时还未能发挥想象中的性能,不过其作用是值得期待的。
Intel Processor Trace,进一步提升对CPU的debug能力
这是一个与编程/调试有关的特性,基本上笔者很少接触。可以肯定的是,和著名的PMU(以及前面的RDT)一样,IPT将会进一步提升开发者对系统的控制能力。
Broadwell-EP Summary:新的Broadwell微架构和架构很好很强大
经过对Core和Uncore的解析,我们对Broadwell-EP的设计实现细节有了一个初步的了解,接下来就是我们的测试环节。
好文章,需要你的鼓励
三星与AI搜索引擎Perplexity合作,将其应用引入智能电视。2025年三星电视用户可立即使用,2024和2023年款设备将通过系统更新获得支持。用户可通过打字或语音提问,Perplexity还为用户提供12个月免费Pro订阅。尽管面临版权争议,这一合作仍引发关注。
浙江大学团队提出动态专家搜索方法,让AI能根据不同问题灵活调整内部专家配置。该方法在数学、编程等任务上显著提升推理准确率,且不增加计算成本。研究发现不同类型问题偏爱不同专家配置,为AI推理优化开辟新路径。
苹果M5 MacBook Pro评测显示这是一次相对较小的升级。最大变化是M5芯片,CPU性能比M4提升约9%,多核性能比M4 MacBook Air快19%,GPU性能提升37%。功耗可能有所增加但电池续航保持24小时。评测者认为该产品不适合M4用户升级,但对使用older型号用户仍是强有力选择。
清华大学研究团队提出SIRI方法,通过"压缩-扩张"交替训练策略,成功解决了大型推理模型"话多且准确率低"的问题。实验显示,该方法在数学竞赛题上将模型准确率提升43.2%的同时,输出长度减少46.9%,真正实现了效率与性能的双重优化,为AI模型训练提供了新思路。