富士通RX4770 M1服务器CPU性能测试---至顶网

ZDNet>CSC频道>富士通RX4770 M1服务器CPU性能测试

扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条

我们收到的富士通Primergy RX4770 M1配置非常强悍，特别是在CPU和内存方面。

来源：ZDNetCBSi企业方案解决中心频道 2014年10月20日

关键字：SPEC 2016 SPEC CPU2006 SPEC RX4770 Ivy Bridge-EX Xeon E7 v2 富士通 Fujitsu

【ZDNet企业解决方案中心】作为Primergy家族的高端机型，富士通Primergy RX4770 M1机架服务器采用的是高端的Xeon E7 v2处理器，也就是为人熟知的Ivy Bridge-EX处理器，后缀EX意思是Expandable，可扩展。和EP系列不同，EX系列处理器可以扩展至最多256路多处理器系统，额外地，EX系列处理器在IA架构中具有除了IA64之外的最为强大的RAS（Reliability, Availability, Serviceability，可靠性、可用性和可服务性）特性，主打的就是企业级关键业务市场。

富士通Primergy RX4770 M1服务器，4U高度

　　在Primergy系列当中，RX4770 M1是属于中端的型号，不过我们收到的RX4770 M1服务器算是高配置，颇具看头：四路Xeon E7-4850 v2，然后满配一共96条8GiB内存，总共768GiB，SAS HDD也配备了8个，另外万兆网卡、8Gb FC卡若干……Xeon E7-4850 v2在Xeon E7 v2当中不算高端，但也拥有着十二核心的配置，搭配超线程技术，我们手上的RX4770 M1一共提供了96个硬件线程：

RX4770 M1服务器采用的CPU：Intel Xeon E7-4850 v2，FC LGA2011封装，12个核心，基础频率2.30GHz，最大可以睿频至2.8GHz，E7-4850 v2最多支持四路配置

RX4770 M1服务器的热插拔内存模块，每模块12个DIMM，支持最大64GiB内存条（使用LR内存），每模块可达768GiB，支持DDR3-1066/1333/1600，在3DPC的配置下是运行在DDR3-1066

一共8个内存模块，合计最多6TiB内存容量，我们收到的服务器配置的是8GiB的内存条，总容量768GiB，就送测的来说，是笔者接触过的最大内存的机器

　　可以看到，我们收到的富士通Primergy RX4770 M1配置非常强悍，特别是在CPU和内存方面，关于它的详细配置还可以看这里：

只为关键业务富士通Primergy RX4770 M1服务器解析

　　接下来我们将会对它进行多种针对性的测试，下面先进行的是SPEC CPU2006，主要考察的是其CPU和内存子系统的能力。

　　SPEC CPU是一个应用广泛的大型CPU性能测试项目。SPEC是标准性能评估公司（Standard Performance Evaluation Corporation）的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织，这个组织的目标是建立、维护一套用于评估计算机系统的标准。除了SPEC CPU之外，SPECviewperf系列产品也是常见的测试工作站/图形卡部件所用到的测试软件。

　　SPEC CPU是SPEC组织推出的一套CPU子系统评估软件，目前最新版本是SPEC CPU2006，它包括CINT2006和CFP2006两个子项目，分别用于测量整数性能和浮点性能。SPEC CPU的测试组件均来源于真实的应用程序，并经过修改以降低对IO子系统的影响，在测试中，测试系统的处理器、内存子系统和使用到的编译器（SPEC CPU提供的是源代码，并且允许测试用户进行一定的编译优化）都会影响最终的测试性能，而I/O（磁盘）、网络、操作系统和图形子系统对于SPEC CPU2006的影响非常之小。

　　SPEC CPU2006包括了12项整数运算和17项浮点运算，除此之外，还有两个随机数产生测试程序998.sperand（整数）和999.specrand（浮点），它们虽然也包含在套件中并得到运行，但是它们并不进行计时以获得得分。这两个测试主要是用来验证一些其他组件中会用到的PRNG随机数生成功能的正确性。各个测试组件基本上由C和Fortran语言编写，有7个测试项目使用了C++语言，而Fortran语言均用来编写浮点部分。SPEC CPU2006以一台Sun Ultra Enterpirse 2工作站作为基准参考系统，系统基于一颗296MHz的UltraSPARC II处理器，测试的得分就表明这个项目中测试系统相对基准系统性能的比值。

整数测试
子项目	说明
400.perlbench PERL编程语言	负载由三个script组成：主负载是垃圾邮件检测软件SpamAssassin 一个是email到HTML的转换器MHonArc 最后一个是specdiff
401.bzip2 压缩	负载包括六个部分：两个小的JPEG图片一个程序一个tar打包的几个源程序文件一个HTML文件混合文件，包括压缩过的高可压缩文件及不怎么可压缩的文件测试分别使用了三个不同的压缩等级进行压缩和解压缩
403.gcc C编译器	对9组C代码进行了编译
429.mcf 组合优化	MCF是一个用于大型公共交通中的单站车辆调度的程序，429.mcf使用32/64位模型时分别需要约860/1700MB的内存
445.gobmk 人工智能：围棋	围棋
456.hmmer 基因序列搜索	使用HMMS(Hidden Markov Models，隐马尔科夫模型) 基因识别方法进行基因序列搜索
458.sjeng 人工智能：国际象棋	国际象棋
462.libquantum 物理：量子计算	libquantum是模拟量子计算机的库文件，用来进行量子计算机应用的研究
464.h264ref 视频压缩	使用两种配置对两个YUV格式的源文件进行H.264编码
471.omnetpp 离散事件仿真	对包括约8000台计算机和900个交换机/集线器以及混合了各种从10Mb到1000Mb速率的大型CSMA/CD协议以太网络的模拟
473.astar 寻路算法	实现了2D寻路算法A*的三种不同版本
483.xalancbmk XML处理	XML文档/XSL表到HTML文档的转换
浮点测试
410.bwaves 流体力学	对三维瞬跨音速粘性流中冲击波的模拟计算
416.gamess 量子化学	三种SCF自洽场计算：胞嘧啶分子水和Cu²⁺离子三唑离子
433.milc 量子色动力学	四维SU(3)格点规范理论的模拟，用来研究QCD量子色动力学、夸克及胶子
434.zeusmp 物理：计算流体力学	用来计算理想、非相对论条件下的流体力学和磁流体力学，434.zeusmp模拟计算了一个统一磁场中的3D冲击波
435.gromacs 生物化学/分子力学	GROMACS是一个生物分子力学计算套件，然而也可以用于非生物系统，435.gromacs模拟了在一个水和离子溶液中的蛋白质溶菌酶结构在各种实验手段如核磁共振的X光照射下的变化
436.cactusADM 物理：广义相对论	436.cactusADM对时空曲率由内部物质决定的爱因斯坦演化方程进行求解，爱因斯坦演化方程由10个标准ADM 3+1分解的二阶非线性偏微分方程组成
437.leslie3d 流体力学	LESlie3d是用来计算湍流的计算流体力学程序，437.leslie3d计算了一个如注入燃烧室的燃油这样的时间分层混合流体
444.namd 生物/分子	NAMD是一个大型生物分子系统并行计算程序，444.namd模拟了了92224个原子组成的A-I载脂蛋白
447.dealII 有限元分析	deal.II是定位于自适应有限元及误差估计C++库，447.dealII对非常系数的亥姆霍兹方程进行求解，它使用了基于二元加权误差估计生成最佳网格的自适应方法，该方程在3维得解
450.soplex 线形编程、优化	SoPlex使用单纯形算法解线性方程
453.povray 影像光线追踪	POV-Ray是一个光线追踪渲染软件，453.povray渲染一幅1280x1024的反锯齿国际象棋棋盘图像
454.calculix 结构力学	CalculiX是一个用于线性及非线性三位结构力学的有限元分析软件，454.calculix计算了一个高速旋转的压缩盘片在离心力的作用下的应力和变形情况
459.GemsFDTD 计算电磁学	459.GemsFDTD使用FDTD（有限差分时域）方法求解三维时域中的麦克斯韦方程，计算了一个理想导体的雷达散射截面
465.tonto 量子化学	Tonto是一个面向对象的量子化学程序包，465.tonto计算面向量子晶体学，它基于一个符合X光衍射实验数据的、约束的分子Hartree-Fock波函数
470.lbm 流体动力学	470.lbm使用LBM（格子波尔兹曼方法）模拟非压缩流体，它模拟了两种情况：类似活塞推动的剪切驱动流体和管道流体，测试包含了3000个步骤
481.wrf 天气预报	481.wrf基于WRF(Weather Research and Forecasting)模型，对NCAR（美国国家大气研究中心）的数据进行了计算，数据包括了UTC 2001.06.11到UTC 2001.06.12以三小时为间隔的数据
482.sphinx3 语音识别	语音识别

　　我们仍旧使用了SPEC CPU2006的1.2版本进行测试，但是我们对编译代码进行了升级。在之前，我们测试使用的Inte C&Fortran编译器版本是13.0，现在，我们使用了较新的Intel C&Fortran 14.0编译器，代码一样基于Intel AVX指令集进行优化，但总体性能有所提升。为了能去掉编译器的影响，我们同样使用ICL 14.0编译代码对基准测试平台做了测试。我们的基准平台也有所改变，使用的是Intel最新的Haswell-EP平台。使用的操作系统也和以往略有不同，以往均基于CentOS 6.4/6.5操作系统，而由于主板Firmware的关系，最新的Haswell-EP平台目前仅能安装SUSE Enterprise Linux Server 11 SP3，我们因而也统一转向了这个操作系统，测试使用的是默认的Linux Kernel 3.0.76-0.11.1。透明大页打开，另外代码还使用了MicroQuill的SmartHeap 10.0。

Fujitsu Primergy RX4770 M1在SUSE Enterprise Linux Server 11 SP3的系统监视器下

2014年9月，Intel Haswell-EP处理器评测 by ZDNet企业解决方案中心 Lucifer

2013年9月，Intel Ivy Bridge-EP处理器评测 by ZDNet企业解决方案中心 Lucifer，富士通服务器使用的Ivy Bridge-EX处理器具有完全一样的内核架构

　　除了整数运算和浮点运算的差别之外，SPEC CPU2006测试还分两种：SPEED测试和RATE测试，SPEED测试类型运行单个实例，用来测试系统运行单作业的时候的运算能力，RATE测试则是运行多个实例，用来测试系统的总运算吞吐能力。SPEC CPU测试还会给出两种类型的结果：Base基准测试结果和Peak峰值测试结果，Base测试要求编译器套件按照指定的规则进行优化，而Peak测试则可以允许使用更多地优化技术，可以看出，前者可以用来简单对比不同的平台，而后者则在对比因素中加入了编译器等因素，有实力编写编译器的厂商可以从中获益。本页给出的是SPEED测试结果，按照整数到浮点、Base测试到Peak测试排列四个成绩图标，每个图表给出了测试系统及对比系统的每个子项目的成绩。图表图例文字中最后的"4S48C96T"字段指的是4 Sockets、48 Cores、96 Threads，意思是“4插槽48核心96线程”。

　　我们先进行了SPEED测试，特别指出的是，在2个，或者1个核心满负荷的时候，由于Intel Turbo Boost睿频技术的作用，Intel Xeon E5-2699 v3将运行在3.6GHz，Intel Xeon E7-4850 v2将运行在2.8GHz，差距达到了800MHz：

SPECint_base2006，整数，SPEED测试，Base基准测试

　　由于462.libquantum 物理：量子计算在SPEED测试当中也可以分散到多个线程进行处理，因此这一项的得分异常地高，导致其它项目显得比较低。由于多路系统的处理器通常主频要低一点，因此SPEED测试多路平台不占优势。

SPECint2006，整数，SPEED测试，Peak峰值测试

　　和SPECint_base2006的状况类似。

SPECfp_base2006，浮点，SPEED测试，Base基准测试

　　比较单一的任务还是主频较高的Haswell-EP占据优势，不过我们可以看到陆470.lbm 流体力学这样的项目，更多的核心也有其优势。

SPECfp2006，浮点，SPEED测试，Peak峰值测试

　　同上。

　　SPEED测试关注的是快慢为主，而RATE测试关注的是计算吞吐量，这也是一般服务器应用关注的指标。RATE测试会导致机器处于满负荷运转状态，所有核心的占用率也会达到100%，需要特别注意的是，由于Intel Turbo Boost睿频技术的作用，在所有核心满负荷的时候，Intel Xeon E5-2699 v3工作在2.8GHz，Intel Xeon E7-4850 v2应该工作在2.5GHz：

SPECint_rate_base2006，整数，RATE测试，Base基准测试

　　多路系统通常在RATE测试中占据优势，富士通Primergy RX4770 M1，四路Xeon E7 v2，其整数吞吐量比新一代的二路Xeon E5 v3要高20%。

SPECint_rate2006，整数，RATE测试，Peak峰值测试

　　峰值性能仅供参考。

SPECfp_rate_base2006，浮点，RATE测试，Base基准测试

　　浮点吞吐量上，富士通Primergy RX4770 M1采用的四路Xeon E7 v2比二路Xeon E5 v3要高43%。

SPECfp_rate2006，浮点，RATE测试，Peak峰值测试

　　仅供参考。

【ZDNet企业解决方案中心】对于关键业务，性能和可靠性都很重要，主流的双路处理器系统在单机性能和可靠性都不及面向关键业务设计的四路、多路系统，其中性能还不是最重要的，因此，以往Intel使用二路和四路及以上作为产品线划分，现在则不同，主要面向二路的Xeon E5也有四路的产品，如Xeon E5-46xx，而主要面向多路系统的Xeon E7也有二路产品，如Xeon E7-2xxx几个型号。可见，现在产品线划分的一个很大因素就是可靠性，这是Xeon E5所不及Xeon E7的地方。

富士通Primergy RX4770 M1服务器，四路Xeon E7 v2

　　在我们的测试当中，Primergy RX4770 M1在性能上要比最新的Haswell-EP——二路Xeon E5-2699 v3性能要高20%（整数）、43%（浮点），而Primergy RX4770 M1采用的是中端的Xeon E7-4850 v2，只具有12个核心，最高端的Xeon E7 v2可以具有15个核心，因此可以提供更强大的运算能力，当然，还有需求的话，还可以使用8路或者8路以上的机器。

RX4770 M1服务器采用的Intel Xeon E7-4850 v2处理器，十二个核心，基础频率2.30GHz，最大可以睿频至2.8GHz

RX4770 M1服务器的热插拔内存模块，每模块12个DIMM，支持最大64GiB内存条（使用LR内存），每模块可达768GiB

　　还有内存也值得一提，富士通Primergy RX4770 M1提供了96个DDR3 DIMM，最多可以支持6TiB的内存，我们测试的机器实配768GiB，可以充分满足测试的需求。极大的内存支持，也是Xeon E5所不及的部分，在内存数据库等领域，Xeon E7具有相当的优势。

只为关键业务富士通Primergy RX4770 M1服务器解析

2013年9月，Intel Ivy Bridge-EP处理器评测 by ZDNet企业解决方案中心 Lucifer，富士通服务器使用的Ivy Bridge-EX处理器具有完全一样的内核架构