扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
【ZDNet企业解决方案中心】随着NAND Flash工业发展,其性能的逐渐提升,SSD,固态硬盘也开始逐渐转向了PCIe(PCI Express)接口,采用PCIe接口的SSD我们也将其称为闪存卡。在上一年2013年,我们测试了一些闪存卡产品,如Intel的SSD 910和Memblaze的Q520,但它们也只是市场中新推出的一小部分。预计到了今年,在2014年,闪存卡——PCIe SSD将会进一步成熟,其中的玩家也会更多,而对应的产品也将会更多。
Intel SSD 910固态硬盘,是Intel的第一款PCI Express插卡式固态硬盘,也是将磁盘控制器和固态硬盘集中到一块PCIe插卡上的典型例子
PCIe SSD也有几种架构类别,我们最早测试的Intel SSD 910固态硬盘,就属于将磁盘控制器和固态硬盘集中到一块PCIe插卡上的产品,这种产品的架构很原始,无法完全发挥PCI Express界面的全部威力,但是这种产品居然性能还不错。
Memblaze Q520 800GB SSD,采用了Memblaze定义为Deviced Base的第三代PCI Express固态硬盘架构
2013年我们还测试了一家初创企业——Memblaze忆恒创源推出的PCIe接口固态硬盘产品Memblaze Q520,它和当时其它的产品架构都不同。在技术上,Memblaze将SSD 910这样的产品定义为第一代PCIe闪存卡,而将其推出的产品称之为第三代PCIe闪存卡,粗略点来说,Memblaze将FTL(Flash Translation Layer)的位置作为其独有的特性,这点可以查看这里: 《MemBlaze Q520企业级PCIE固态硬盘评测》。在这里我们必须得更正,忆恒创源使用的英文名是Memblaze而不是我们写的MemBlaze。
Memblaze PBlaze 3 1.2TB SSD,是Q520的下一代产品,架构和性能得到了全面的提升,它特别搭载了Piano Key琴键技术
到了2014年Memblaze已经不算初创企业了,其当前主推的产品对比Q520又有了更新,2013年下半年,我们对其推出的新一代产品——PBlaze 3进行了测试,需要特别说明的是,我们当时称Memblaze的产品都采用了中国古代名剑的名称命名,但是PBlaze 3并不是这样,因为它采用了Memblaze的琴键技术。
PBlaze 3采用了环保包装,注意:宣传册并不包含在内,这是在IDF北京2013上的PBlaze宣传资料。
泡沫塑料加上防静电袋保护是很自然的,因为这块卡对一般人来说有点贵。
其控制芯片上采用了大块铝散热片作为被动散热方案。
PCB比较精致。
PCB是黑色的,背面在相对控制芯片的位置有5块RAM芯片,显然,这是一个ECC配置。PBlaze 一共搭载了9块Micron的D9GBJ内存颗粒,容量为512MiB,因此整块卡的RAM是4GiB,规格应该是DDR3-1600。
Memblaze Q520使用的是接口PCI Express 1.1 x8,到了Memblaze PBlaze 3,接口升级到了PCI Express 2.0。PCIe 2.0对比1.x最主要的区别就是传输速率翻倍,PCIe 1.1 x8能提供2GiB/s的单向带宽和4GiB/s的双向带宽,PCIe 2.0 x8则能达到4GiB/s单向和8GiB/s双向,对于大部分设备来说已经足够。
本页我们将对PBlaze 3进行拆解,并解释PBlaze 3使用的“琴键”技术,这也是它不再使用中国古代名剑作为中文名的原因。
取下左上方的保护盖的样子,可以直接看到12块NAND Flash芯片。
采用的NAND Flash芯片是TOSHIBA的TH58TE6902HBA89,我们并没有查到其规格。
可以看到,我们手上的这块PBlaze 3具有4个NAND Flash模块,每个模块规格可以相同也可以不相同,这种设计就是Memblaze的Piano Key琴键设计,PBlaze 3最前面的"P"就是"Piano"的"P"。
每个模块具有6个NAND芯片,一共就是24个芯片,组成了1.2TB的容量。
Xilinx Kintex-7 XC7K325T FPGA,28nm HKMG(High-K Metal Gate)、HPL(High-performance, low-power)工艺,72bit DDR3-1866内存界面,最高可以提供2845 GMAC/s的峰值DSP性能。当然,硬件只是一方面,怎么对FPGA编程才是各家本领所在。
下面我们来看下Memblaze PBlaze 3独特的琴键技术:
Piano Key,琴键技术,最直观的效果就是容量可以自由地选择,Low Profile(Half-height,半高)版本有4个Key(模块),High Profile(Full-height)版本则有8个Key,搭配不同容量的模块最终可以达到38种不同的容量。搭配的模块有M3(192GB)、M4(256GB)、M5(320GB)、M6(384GB)四种,并且具有MLC和SLC的区别——SLC版本是MLC版本容量的一半。
琴键技术有什么好处呢?不同类型的系统,具有不同的闪存容量需求,one size do not fit all,闪存卡这种东西成本本来就比较高,要是买了过大的容量,就会导致浪费金钱,琴键技术可以让容量达到最适合应用的状态,从而达到降低成本的作用,这就是它的作用。
看完硬件之后,我们再来看看参数总结:
前面说过,PBlaze 3有半高(PBlaze 3L)和全高(PBlaze 3H)两种类型,全高具有8个模块,因此性能要比半高的高不少。从指标上看,全高的PBlaze 3H可以达到3.5GB/s的读取带宽和2.5GB/s的写入带宽,半高的PBlaze 3L则是2.5GB/s和1.3GB/s。即使是半高的PBlaze 3L,对比上一代Q520的指标1500MB/s和700MB/s都有了很大的提升。此外,PBlaze 3可以提供的4K随机读写IOPS为800k/280k(Pblaze 3H SLC),典型读写延迟60μs/14μs,而上一代Q520提供的4K随机读写则是370k/80k,典型读写延迟为130μs/26μs,提升巨大。
我们使用的是一台超频到4.5GHz的Core i7 3960X机器,Core i7 3960X代号Sandy Bridge-E,提供了36条PCI Express 3.0 Lane。驱动则使用了MemBlaze准备的0.0.54.0——在测试期间,MemBlaze根据反馈升级了数次驱动。Memblaze的驱动实现了其“Device Based”的架构,占用的内存非常小,而“Host Based”架构的闪存卡则需要占据大量的内存进行FTL(Flash Translation Layer),这点可以查看这里: 《MemBlaze Q520企业级PCIE固态硬盘评测》。
我们使用了Iometer 1.1.0 rc1对固态硬盘进行了测试,测试操作系统是Windows Server 2012 R2,使用Memblaze最新的Firmware和驱动(测试期间我们对Firmware也进行了一次升级)。
首先进行的是一个512字节的最小区块测试,对于固态硬盘来说,正常工作的区块都是4k、8k这样的“簇”容量,512字节显得过小了,它会影响到性能,因此仅供参考。实际上,Memblaze设计以及驱动编写时均考虑的是4KiB块的性能,早期甚至不支持512B读写,后来经我们反馈后加上了该功能。我们所有的测试都在4KiB对齐的环境下进行。
很自然地,在整个测试中我们拿Memblaze Q520作为对比产品。
512B的极小区块对于近代的存储来说已经不太合事宜,仅供参考。测试中,单个Worker已经不能完全发挥PBlaze 3的能力,在16 workers下,PBlaze可以提供561.5k的512B随机读取IOps。
流行的指标是4KiB块读写,4K读写也是固态硬盘最为关注的指标之一。在4KiB连续读取中,单worker的峰值是442k IOps,在16 worker下则可以达到488k,比Q520的峰值316k要高54.4%左右。
企业级应用中,随机存取性能比连续存取更为重要一些,PBlaze 3 1.2TB可以达到720k IOps(16 worker下),是上一代Q520的近5倍。
4KiB写入的话PBlaze 3的提升非常明显,峰值可以达到628k IOps,而Q520只有88.4k IOps,提升幅度是610%。
和4KiB读取一样,4KiB随机写入也是一个很重要的指标,Memblaze PBlaze 3的峰值可以达到269k IOps,不过在测试中可以看到连续下降的趋势,这也是从开箱性能过渡到稳定性能的表现,稳定情况下PBlaze 3得到的数字约是228k IOPS,是Q520的10倍。
我们使用较大的区块来测试存储的最大传输速率,在使用1MiB的区块进行连续读取时,Memblaze PBlaze 3展现的单Worker连续读取带宽为2098MB/s,在多Worker环境下,性能相对要低一点。
除了突出的4K随机读取性能之外,Memblaze还聚焦在降低延迟方面,Memblaze认为,“平均延迟”和“延迟抖动”是企业级Flash存储的两个重要指标,因此,Memblaze提供了“Ultra-Low Latency Wearleveling on Device-Based(基于设备的极低延迟写入损耗平衡)”和“Latency Smoothing Technology(延迟平滑技术)”两个技术对这两个重要指标进行底层算法优化。
更多个Worker会提供更好的性能,但是会导致整个存储的延迟提升,然而即使是在16队列深度下,PBlaze 3的4KiB随机读取延迟也只有Q520的约1/2,IOps则是Q520的近5倍。
测试中达到712k IOps的截图,Windows下中断处理仍然是个问题。
4KiB随机写入我们只有12 worker的数据,它延迟要比单worker的Q520高113%,但比16 worker的Q520要低很多。
接下来看看Iometer的企业级负荷脚本测试指标,仅供参考:
文件服务器混杂了各种块大小的读取和写入操作,PBlaze 3约是Q520的2.5倍。
网站服务器主要是较小区块的随机读取,PBlaze 3的性能优势略低一点,约是Q520的2.2倍。
数据库服务器是67%读取和33%写入的100%随机操作,主要是小区块,这种环境下很适合PBlaze 3的发挥,它的性能越是Q520的3.6倍。
工作站是80%的读取和20%的写入,随机度比服务器的要小,为80%,工作站也属于小区块的操作,Memblaze PBlaze 3的性能约是Q520的2.7倍。
【ZDNet企业解决方案中心】Memblaze PBlaze 3搭载了其独创的Piano Key琴键技术,从而让其容量可以自由地调整,一共有38种选择,最大容量可以达到2.4TB。我们测试的是半高的版本,容量最大可以达到1.2TB,只有全高版本可以达到2.4TB的容量。
测试时使用的平台配置比较高,可以充分发挥出Memblaze PBlaze 3的实力,测试结果是Memblaze PBlaze 3的4KiB随机读写性能可以达到720k IOps/228k IOps,和理论性能很接近。
在各种理论性能上,Memblaze PBlaze 3都是上一代Q520的5~6倍,而在企业级负载脚本中,也能达到2.2~4.6倍,此外,在同样更高的性能下,PBlaze 3的延迟也要更低。
Memblaze PBlaze 3 1.2TB SSD,是Q520的下一代产品,架构和性能得到了全面的提升,它特别搭载了Piano Key琴键技术
性能是PBlaze 3的一大特点,720k的4KiB随机读取低IOps在PCIe SSD当中也是很强劲的。此外,Memblaze PBlaze 3独特的琴键技术也带来了可供自由选择的容量特性,一共38种容量选择,用户可以根据应用需求进行精确的定制。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。