科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

ZDNet>CSC频道>MemBlaze Q520企业级PCIE固态硬盘评测

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

作为获得国际风投公司青睐的本土闪存加速卡初创企业,MemBlaze(忆恒创源)开发的PCIe闪存加速卡产品均以中国古代名剑命名,像我们测试的这款Q520就名为“合伯”。它的“锋利”体现在哪里呢?

来源:ZDNetCBSi企业方案解决中心频道 2013年04月01日

关键字:固态硬盘 MemBlaze SSD

  基于对性能的渴望,除了紧随SAS(Serial Attached SCSI,串行附加SCSI)接口发展提升速率之外,另一个途径就是采取更高速、与CPU/内存距离更近的接口,例如,PCI Express接口。PCI Express接口比通常的SAS/SATA接口提供了更大的带宽,并且可以减少中间的连接转换层。

  一般的插卡式PCI Express固态硬盘仅仅是将磁盘控制器和固态硬盘集中到一块PCIe插卡上,不过业界包括Intel在内均开始了进一步集成的研究,如T10/INCITS的SOP/PQI(SCSI over PCIe/PCIe Queuing Interface)以及Intel的NVMe(Non-Volatile Memory Express),此外还有一些专有的方案,这些方案都将FTL(Flash Translation Layer,闪存转换层)与PCI Express界面集成到同一个控制器当中,或者干脆就用软件来实现FTL,因此比起传统的SSD其延迟大为降低,可以达到非常优异的性能水准。

Intel SSD 910企业级PCIE固态硬盘评测
Intel SSD 910固态硬盘,是Intel的第一款PCI Express插卡式固态硬盘,也是将磁盘控制器和固态硬盘集中到一块PCIe插卡上的典型例子

  之前我们测试了Intel的SSD 910固态硬盘,就是采用了PCI Express接口的插卡式固态硬盘,尽管它性能十分不错,但是它确实属于典型的将磁盘控制器和固态硬盘集中到一块PCIe插卡上产品,这种产品的架构很原始,无法完全发挥PCI Express界面的全部威力。

MemBlaze Q520企业级PCIE固态硬盘评测
MemBlaze Q520 800GB SSD,采用了MemBlaze定义为Deviced Base的第三代PCI Express固态硬盘架构,比市面产品均要领先一到两代

  近年,一家国内的厂商MemBlaze推出了新的PCI Express接口固态硬盘产品,它属于专有方案的分类,在技术上,MemBlaze将SSD 910这样的产品定义为第一代PCIe闪存卡,而将其推出的产品称之为第三代PCIe闪存卡,这些“代”数有什么差异?MemBlaze的产品有什么特别?接下来我们就可以看到。 

  按照PCI Express闪存卡架构的区别,MemBlaze将目前的PCIe闪存卡分为了三代:ROC(RAID on Chip)Host BasedDevice Based,严格来说第一代ROC或许该称为HROC(HBA/RAID on Chip),因为如Intel SSD 910这样的产品没有使用RAID芯片,它就是通过一个HBA界面卡连接了4个(或2个)SAS SSD,在这些SAS SSD上,具有独立的SAS/NAND ASIC,内含FTL电路,如下图所示:

Intel SSD 910企业级PCIE固态硬盘评测
800GB版本Intel SSD 910固态硬盘的架构,由一个SAS HBA和4个SAS SSD模块组成

  MemBlaze分类的第二种是Host Based(基于主机),第二第三代已经将FTL迁入了整个闪存卡的控制器当中,比第一代硬件架构更为简洁。Host Based的意思是,这些闪存卡的Metadata在主机上进行管理,这将会消耗大量的内存并占用CPU来进行处理,而且很容易因为操作系统的失效而造成数据损坏。MemBlaze的产品使用的第三类Device Based(基于设备)则是将Metadata的管理完全迁入固态硬盘卡,从而节约内存和CPU,并提供更强的可靠性和更好的性能,如下图所示:

MemBlaze Q520企业级PCIE固态硬盘评测
MemBlaze根据架构定义的三代PCIe闪存卡,自然,它们自身的产品属于第三代

  在MemBlaze的一个Slides当中,MemBlaze总结了第二代和第三代闪存卡的区别:“Device Based产品与Host Based产品的最大区别在于,Device Based PCIe Flash存储卡的FTL(Flash Translation Layer)是在板卡内部进行处理的,而Host Based PCIe Flash存储卡产品的FTL是在驱动端完成的。“

  从我们的观点看,MemBlaze的分类并不很符合工业规范,不过也不无道理,下面我们就以MemBlaze Q520 800GB SSD为例,在介绍这款产品的同时印证下第三代Device Based闪存卡的架构。

  MemBlaze Q520,是一款具有200、400、800GB三种容量的PCIe闪存卡,可以使用SLC或者MLC的NAND闪存芯片,我们收到的为800GB的型号,采用的是MLC芯片。Q520闪存卡是全高半长的规格:

MemBlaze Q520企业级PCIE固态硬盘评测
MemBlaze Q520,这张图的分辨率要比开头的图要大一些

  Q520显得比较厚重——它确实也比较重,原因是几乎覆盖了90%单面面积的黑色铝散热器,其厚度接近了一个插槽宽度。Q520是被动散热方案,没有风扇噪音,也没有机械部件的可靠性的烦恼,不过代价是需要注意散热。Q520发热量比较大,温度略高。不过,在我们做测试的一个开放平台(室温20度)上,没有风扇也能正常工作。

MemBlaze Q520企业级PCIE固态硬盘评测大面积散热片,而且这散热片实在是拆不下来

  散热器没有覆盖到的地方,都是电源部分:

MemBlaze Q520企业级PCIE固态硬盘评测
一块独立的小电路板上放着16个270μF的三洋固态电容

MemBlaze Q520企业级PCIE固态硬盘评测电源板,以及PCB的厚度

MemBlaze Q520企业级PCIE固态硬盘评测
MemBlaze的字样,这块Q520采用的是PCI Express 1.1 x8的接口,而不是想象中的PCI Express 2.0

  让人略为意外的是,Q520使用的是PCI Express 1.1 x8的接口,而不是PCI Express 2.0。PCIe 2.0对比1.x最主要的区别就是传输速率翻倍,PCIe 1.1 x8能提供2GiB/s的单向带宽和4GiB/s的双向带宽(各种中断、控制信号之类的也包括在内),对于Q520固态硬盘来说足够吗?

  正面的散热器实在是拆不下来,不过我们还是能知晓它采用的NAND芯片——因为它背面还有:

MemBlaze Q520企业级PCIE固态硬盘评测
背面也是密密麻麻的NAND芯片,略微小一些的是控制芯片的RAM芯片

  通过数数,可以发现背后具有32片芯片,正面其实也是一样,这样,整个Q520具有整整64片NAND芯片。

MemBlaze Q520企业级PCIE固态硬盘评测
NAND芯片的型号是Micron的29F128G08CJABA,16GiB、34nm MLC芯片

  芯片型号则是Micron 29F128G08CJABA,16GiB、34nm MLC,略为早期的产品,64片的总容量达1TiB,不过提供给用户的只有800GB,注意到GiB和GB的差别的话,MemBlaze Q520提供给用户的容量只有芯片容量的74.5%,剩余的容量被用作磨损控制或Over-Provision。

MemBlaze Q520企业级PCIE固态硬盘评测正反各32片NAND,RAM在背面是4片,正面是5片

MemBlaze Q520企业级PCIE固态硬盘评测
RAM的型号是Micron的D9MTG,128MiB DDR2 RAM芯片

  使用的缓存则是Mircon D9MTG,这是个8bit 128MiB的DDR2 RAM芯片,据了解,一共有9片,其中一片做ECC校验,8片数据RAM总容量达到了1GiB

MemBlaze Q520企业级PCIE固态硬盘评测大面积镂空面板用于散热

  MemBlaze Q520乃至MemBlaze的全线闪存卡的特点都是采取了自己的主控芯片,实际上它就是一块通用的FPGA,型号是Xilinx XC5VLX155T,这块具有330k逻辑元的FPGA具有25 x 18个DSP slices,并集成了PowerPC 440微处理器块,工作频率为550MHz:

MemBlaze Q520企业级PCIE固态硬盘评测MemBlaze Q520使用的是Xilinx的XC5VLX155T FPGA芯片,65nm铜CMOS工艺,它属于Xilinx的Virtex-5 LXT系列,更多的信息可以看这里:Xilinx Virtex-5 FPGA Devices

  FPGA是通用的,精髓在于FPGA里面定制的逻辑,这也是MemBlaze核心竞争力之一。

  看完硬件之后,我们再来看看总结,下面这个从用户手册里面摘录的图表可以一览Q520的参数:

MemBlaze Q520企业级PCIE固态硬盘评测
从MemBlaze用户手册上摘取的Q520 SSD数据表

  从指标上看,Q520最大读写速率分别为1500MB/s700MB/s,提供的最大4K随机读写为370k IOPS80k IOPS,典型读写延迟为130μs/26μs,其中随机读取的IOPS和读写延迟引人瞩目,特别是写入延迟——这应该是个缓存后的延迟。

MemBlaze Q520企业级PCIE固态硬盘评测MemBlaze Q520不支持引导操作系统

  随后我们将这块SSD安装到一台双Xeon 5600上进行了测试——后来我们分别也在一台双Xeon E5 2690机器上和一台超频到4.5GHz的Core i7 3960X机器上进行了测试,最终结果使用的机器为基于Core i7 3960X。由于主控芯片是MemBlaze定制的FPGA,因此驱动也由MemBlaze准备——MemBlaze提供了Windows和Linux的驱动,在这个驱动上,MemBlaze实现了“Device Based”的架构,因此它占用的内存非常小,而“Host Based”架构的闪存卡则需要占据大量的内存进行FTL(Flash Translation Layer)。

MemBlaze Q520企业级PCIE固态硬盘评测

Memblaze Monitor

  MemBlaze的一个特点是提供了一个非常不错的管理界面Memblaze Monitor,它提供了对各种参数的实时监视功能,还具有历史曲线显示。

MemBlaze Q520企业级PCIE固态硬盘评测设备寿命和写入放大参数也有展示,从指标上看,非常优异

  接下来我们看看在4.5GHz Core i7 3960X平台上进行的测试,Core i7 3960X是Intel的顶级桌面处理器,代号为Sandy Bridge-E,和企业级的Sandy Bridge-EP属兄弟,它提供PCI Express 3.0总线的支持,不过,在Q520这块卡上,只能发挥到PCIe 1.1的力量。

  我们使用了Iometer 1.1.0 rc1对固态硬盘进行了测试,测试操作系统是Windows Server 2008 R2,使用MemBlaze最新的Firmware和驱动。首先进行的是一个512字节的最小区块测试,对于固态硬盘来说,正常工作的区块都是4k、8k这样的“簇”容量,512字节显得过小了,它会影响到性能,因此仅供参考。实际上,MemBlaze在4K块下发挥最好,512B极受影响,我们仅给出随机读取性能作为参考,需要指出,MemBlaze Q520的所有测试都在4KB对齐的环境下进行,若果没有进行对齐,其性能将会受到不小的影响

  整个测试中作为对比产品的是Intel SSD 910,"200GB x4 MPM"标识的是SSD 910的独特架构:由4个200GB单元组成,因此实际上需要同时运行4个worker,MPM是Max Performance Mode,详见:Intel SSD 910企业级PCIE固态硬盘评测

MemBlaze Q520企业级PCIE固态硬盘评测

  512B的极小区块对于近代的存储来说已经不太合事宜,仅供参考。在单个Worker下,Q520表现出很大的潜力,一直到16个worker、16队列深度(换算单worker可以认为是256队列深度)才达到顶峰,随后开始下降。峰值IOps可以达到328k,比作为对比的Intel SSD 910要高。

MemBlaze Q520企业级PCIE固态硬盘评测

  当前最流行的指标是4KB块大小读写,4K读写也是固态硬盘最为关注的指标,Q520在我们的测试当中表现很好。我们先看连续读取,在16 worker、16队列深度下达到了连续读取峰值并不再提升,这个峰值是360k IOPS,比对比的SSD 910的255k要高41.2%

MemBlaze Q520企业级PCIE固态硬盘评测

  而在最为重要的4K随机读取指标中得到的结果则是350k IOPS,在16 worker、64队列深度达到,比SSD 910的219k要高59.8%

MemBlaze Q520企业级PCIE固态硬盘评测

  Q520在最高带宽指标上略有落后,因此4K连续写入则要逊色于4个SAS SSD单元组成的SSD 910,不过数值很是稳定:88.4k IOPS

MemBlaze Q520企业级PCIE固态硬盘评测

  对一些如数据库服务器之类的应用来说,4K随机写入是一个很重要的指标,MemBlaze Q520得到的数字约是88.4k IOPS,和连续写入完全一样,并且在单worker、8队列深度下达到峰值之后就一直维持在相应的水准,非常出色!Q520比对比型号性能要高出66.5%

MemBlaze Q520企业级PCIE固态硬盘评测

  使用较大的区块可以榨取整个存储的最大传输速率,在使用1MB的区块进行连续读取时,MemBlaze Q520得最大带宽为:1400MB/s

MemBlaze Q520企业级PCIE固态硬盘评测

  固态硬盘的写入比读取要慢,MemBlaze Q520的1MB连续最大写入带宽为:671MB/s

  除了突出的4K随机读取性能之外,MemBlaze的一个特长就是延迟,MemBlaze还专门提供了一个Slides描述其闪存卡的低延迟特性,MemBlaze认为,“平均延迟”和“延迟抖动”是企业级FLash存储的两个重要指标,因此,MemBlaze提供了“Ultra-Low Latency Wearleveling on Device-Based(基于设备的极低延迟写入损耗平衡)”和“Latency Smoothing Technology(延迟平滑技术)”两个技术对这两个重要指标进行底层算法优化,这两个技术的细节我们不讨论,下面看看我们对Q520进行的延迟测试:

MemBlaze Q520企业级PCIE固态硬盘评测

  在50k的4K随机读取IOPS下,Q520的Iometer最大读取延迟是162μs,这是个很不错的数字,Memblaze Monitor的读数则是161.3μs平均延迟。

MemBlaze Q520企业级PCIE固态硬盘评测

  在337k的IOPS下,最大延迟上升到1138ms。接下来我们看看具体的图表,以4KB随机读取为例,需要注意的是下图中对比的目标为单个SSD 910 200GB模块,模式为MPM(最大性能模式),同时测试4个模块的话延迟将会继续上升:

MemBlaze Q520企业级PCIE固态硬盘评测

  由于低队列深度延迟极低,采取线性Y坐标轴的图表就会变成上图这样,因此我们又绘制了对数Y坐标轴的图:

MemBlaze Q520企业级PCIE固态硬盘评测

  可见,平均延迟上,Q520要比参考的产品要低不少,在256队列深度,Q520仅为目标的17.3%

MemBlaze Q520企业级PCIE固态硬盘评测

  平均写入延迟也非常低,最低值可以低到35μs(全系统平均延迟),Q520比参考产品在256队列深度要低37.4%,而在队列深度为1时,Q520的延迟仅为对比型号的21.5%,也就是要低78.5%

MemBlaze Q520企业级PCIE固态硬盘评测

  作为参考,我们也给出了512字节下的延迟数据,MemBlaze Q520的表现仍然很是不错。

  接下来看看Iometer的企业级负荷脚本测试指标,仅供参考:

MemBlaze Q520企业级PCIE固态硬盘评测

  文件服务器混杂了各种块大小的读取和写入操作,MemBlaze Q520的表现要比对比产品高一倍左右。

MemBlaze Q520企业级PCIE固态硬盘评测

  网站服务器主要是较小区块的随机读取,Q520要比对比产品高了16%左右。

MemBlaze Q520企业级PCIE固态硬盘评测

  数据库服务器是67%读取和33%写入的100%随机操作,主要是小区块,MemBlaze Q520的峰值要高约215%,指标达到了116k IOPS,不过在重负荷时有所回落,维持在94.5k IOPS的水平。

MemBlaze Q520企业级PCIE固态硬盘评测

  工作站是80%的读取和20%的写入,随机度比服务器的要小,为80%,工作站也属于小区块的操作,MemBlaze Q520的峰值要高193%,将近两倍,为132k IOPS,不过重负荷下同样有所回落。

  从测试中我们可以看到,尽管只采用了PCIe 1.1 x8接口,MemBlaze Q520仍然提供了不错的数据吞吐速率(读写:1400MB/s671MB/s),而其小区块IOPS则更为优异,4K随机读取可以达到350k IOPS,写入则可以达到88.4k IOPS

  MemBlaze的产品值得骄傲的是其低延迟,在实际测试当中,系统IO延迟可以达到最低157μs/35μs的水平(4K随机读取/写入,单worker、队列深度为1/2,包括系统处理时间和闪存卡处理时间)。在企业级应用负载脚本中,Q520性能要比对比型号高出16%~200%不等。由于MemBlaze Q520的延迟很低,它极为擅长随机操作。

MemBlaze Q520企业级PCIE固态硬盘评测
MemBlaze Q520 800GB SSD采用了MemBlaze定义为Deviced Base的第三代PCIe固态硬盘架构

  低延迟由MemBlaze的“第三代”闪存卡:Device-Based架构来达成,在MemBlaze的闪存卡上,FTL(Flash Translation Layer)由MemBlaze的定制的FPGA来完成,并通过“Ultra-Low Latency Wearleveling on Device-Based(基于设备的极低延迟写入损耗平衡)”和“Latency Smoothing Technology(延迟平滑技术)”两个技术降低读写的平均延迟和延迟抖动,我们的测试表明,Q520的低延迟在小区块时特别明显。

MemBlaze Q520企业级PCIE固态硬盘评测
MemBlaze Q520闪存卡提供了极快的4K随机读取性能和所有情况下都强劲而均衡的延迟

  比较有意思的一点是,MemBlaze的固态硬盘是以中国古代名剑为名,Q520就属于“合伯”。据悉,Q520属于MemBlaze的初代产品,其第二代很快就要上市,请继续期待我们CBSi企业解决方案中心对这些名剑的测试。

附录:古代名剑

  《史记》载:“天下之剑韩为众。一曰棠溪,二曰墨曜(墨阳),三曰合伯,四曰邓师,五曰宛冯,六曰龙泉,七曰太阿,八曰莫邪,九曰干将。”

推广二维码
邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

重磅专题