Intel Haswell-EP处理器评测

作者：盘骏/Lucifer

通过新加入一个叫做Buffered Switch的装置，Haswell-EP实现了18个核心。

　　看完Core核内的改进之后，我们再来看看Uncore核外的改动，首先是核心互联架构的改进：

Haswell-EP核外改进

　　我们已经知道Haswell-EP具有18个核心，那么，这18个核心的互联就是一个挑战，它会影响到Uncore的设计。上一代的12个核心就已经迫使Ivy Bridge-EP采用了三环形总线的设计，那么Haswell-EP呢？

Haswell-EP核心内部互联的进化，这个进化只有十核心及以上核心数量的型号才具有

　　答案果然是四环形总线，不过是环形总线并不是重点，最主要的地方在于，Haswell将核心分为两组，每组通过一对环形总线连接，就如同低核心数量时一样，并且——Haswell在两组核心之间加入了Buffered Switch（缓冲交换机），这才是重点。根据核心数量的不同，Haswell-EP和上一代一样具有三种不同的晶圆布局，其中HCC（High Core Count）和MCC（Medium Core Count）两种具有Buffered Switch设计。

Haswell-EP的三种晶圆设计

　　显然，Buffered Switch将CPU分为了两个区域，从而让处理器可以容纳更多的CPU核心，不过，Buffered Switch会引入延迟，根据笔者的问询，Intel方回答是，Buffered是FIFO的设计，并具有4~5个时钟周期的延迟，这样的延迟并非刻意忽略，实际上，Intel针对Haswell-EP的状况还准备了一个新的Cluster-on-Die的工作方式：

在具有2个Home Agent的SKU才具有Cluster-on-Die特性

　　Buffered Switch的存在让两个不同的CPU组/分区对其它不同的部件有着不同的延迟，这实际上就和NUMA架构一样，因此Cluster-on-Die显的做法就是在CPU里面实现NUMA——每个CPU组各自拥有各自的内存控制器、Home Agent等，L3 Cache也同时进行分割，整体来说，Cluster-on-Die模式用于降低两个CPU分区之间的通信，从而提升性能，因此，Cluster-on-Die也是一种Snoop模式：

Cluster-on-Die也是一种Snoop模式，因为它影响到了L3 Cache的工作方式