除了前面比较成体系的改进之外,Broadwell的Uncore还有一些杂项提升:
1.Opportunistic Snoop Broadcast,机遇性侦听广播
2.Hardware Controlled Power Management,硬件控制电源管理
3.Intel Processor Trace,Intel处理器追踪
4.DDR4 Write CRC,DDR4写CRC
5.ECRC(End to End CRC Protection) for PCIe IO Subsystems,PCIe IO子系统端到端CRC
杂项改进中笔者最关注的是Hardware Controlled Power Management
其中DDR4写CRC和PCIe IO子系统端到端CRC用来提升内存子系统和PCIe IO子系统的鲁棒性,进一步提升X86系统的可靠性。
这里还给出了不同模式下Broadwell-EP的内存读取延迟和带宽
Hardware Controlled Power Management,缩写是HWPM而不是HCPM,则是笔者最关注部分:
为什么觉得HWPM重要?因为在HWPM之前,CPU的工作状态(C0~C6)是由操作系统控制,一方面,工作有延迟,不能及时反映负载变化,Turbo频率也不够迅速,另一方面,操作系统的软件实现也给系统带来一些负载。遗憾的是,经过测试,这个特性暂时还未能发挥想象中的性能,不过其作用是值得期待的。
Intel Processor Trace,进一步提升对CPU的debug能力
这是一个与编程/调试有关的特性,基本上笔者很少接触。可以肯定的是,和著名的PMU(以及前面的RDT)一样,IPT将会进一步提升开发者对系统的控制能力。
Broadwell-EP Summary:新的Broadwell微架构和架构很好很强大
经过对Core和Uncore的解析,我们对Broadwell-EP的设计实现细节有了一个初步的了解,接下来就是我们的测试环节。
好文章,需要你的鼓励
工业升级的关键,或许在于智能本身。“工业+机器人”将成为通向下一阶段工业体系的核心抓手。——黄仁勋。
浙江大学等联合研究发现,AI强化学习效果取决于"模型-任务对齐"程度。当AI擅长某任务时,单样本训练、错误奖励等非常规方法也有效;但面对陌生任务时,这些方法失效,只有标准训练有用。研究团队通过大量实验证实,这种"舒适圈"现象比数据污染更能解释训练差异,为AI训练策略优化提供了新思路。
瑞士政府正式发布了自主研发的人工智能模型,该模型完全基于公共数据进行训练。这一举措标志着瑞士在AI技术自主化方面迈出重要一步,旨在减少对外国AI技术的依赖,同时确保数据安全和隐私保护。该模型的推出体现了瑞士对发展本土AI能力的战略重视。
巴赫切希尔大学研究团队通过对五种不同规模YOLO模型的量化鲁棒性测试发现,静态INT8量化虽能带来1.5-3.3倍速度提升,但会显著降低模型对噪音等图像损伤的抵抗能力。他们提出的混合校准策略仅在大型模型处理噪音时有限改善,揭示了效率与鲁棒性平衡的复杂挑战。