存储君来了

用FlashSystem做分层,应该怎么做?

IBM FlashSystem可与其他存储产品配合,构建一个完整的存储解决方案。比如,FlashSystem与SVC和其他存储系统共同构建一个完整的存储子系统。SVC能够为FlashSystem提供诸如自动...【详细】

张广彬

CBSi企业解决方案中心首席分析师

向TA提问

刘杰

ZDNet存储频道主编

向TA提问

Q1.FlashSystem支持重复数据删除吗?

IBM Flashsystem并不支持重复数据删除技术。

IBM Flashsystem全闪存阵列是为了满足关键应用对存储系统提出的高性能低延时需求。众所周知,非闪存阵列(HDD)的性能瓶颈大多在于磁盘本身,对控制器的计算能力要求不高,所以能够添加诸如重复数据删除等技术,这并不会对整个存储系统的性能造成太大的影响。

但对于全闪存阵列而言,其性能瓶颈已经不在存储介质本身,而在于控制器本身的计算能力和带宽。如果在全闪存阵列中添加重复数据删除等高级功能,这一技术本身就对计算能力要求较高,会影响闪存的性能发挥;另一方面,增加越多存储高级功能,就意味着要增加更多的软件堆栈,I/O经过这些软件堆栈,不但影响性能,还会大幅增加延时,这并不符合全闪存阵列的初衷。

所以,在IBM Flashsystem中,不但尽量减少软件堆栈,还尽可能地发挥FPGA的优势。这样的好处在于,IBM Flashsystem在一个标准2U高机箱内就能够为前端应用提高高达一百万的IOPS,同时延时还维持在极低的水平。这在业内尚属首家,无人能出其右。

如果用户需要存储高级能够,则可与IBM的另外一个产品——SVC相配合。SVC不仅能够将用户实际环境中的异构存储资源整合到一个单一的资源池,还能够为FlashSystem全闪存阵列提供诸如快照、复制、自动精简配置、数据压缩等等存储高级功能。

Q2.存储中的flash盘 想请教下大家是怎么部署应用的?

IBM FlashSystem可直接作为存储。也可搭配IBM SVC,与其他存储阵列共同组成一个完整的解决方案。其中,IBM FlashSystem既可以作为缓存,也可用作性能层存储,用以满足用户环境内应用对存储提出的苛刻性能需求。

Q3.flashsystem用来做分层怎么样?

IBM FlashSystem可与其他存储产品配合,构建一个完整的存储解决方案。比如,FlashSystem与SVC和其他存储系统共同构建一个完整的存储子系统。在这之中,SVC能够为FlashSystem提供诸如自动精简配置、自动分层存储等高级功能,将FlashSystem可用作性能层,以发挥闪存存储的性能优势,其他存储系统则可以作为数据层,用以存储访问频率不高的数据。

这样,既可以很好地发挥出闪存本身所具有的性能优势,又兼具磁盘存储系统所具有的大容量存储特性。两者的配合可以帮助用户应对多种应用提出的不同存储需求。

Q4.关于flash存储的数据保护问题 IBM采用什么样的方法呢

在IBM FlashSystem系统中,其采用了两种数据保护方式:可变条带RAID(Variable Stripe RAID,简称VSR)和系统级 RAID 5。

在FlashSystem中,其主要分为以下几个逻辑结构:闪存模块、闪存控制器(Flash Controller)、闪存芯片(Flash Chip)、Plane、Block以及Page(依次从大到小)。一个闪存模块最多4个闪存控制器,1个闪存控制器管理20个闪存芯片,一个闪存芯片内部有16个Plane。

VSR主要作用在Plane级,横跨闪存层,采用9+1(Plane) RAID 5的方式实现条带化,RAID条带可根据闪存模块中的闪存Plane故障情况自动调整,比如9+1、8+1、7+1,甚至6+1。当一个或多个Plane发生故障,其将自动重新进行条带化以省却人工干预,并自动继续执行和操作从主机设备过来的读写请求。每个闪存模块中最多可容忍64个Plane故障,或者4个闪存芯片故障。每个Plane则可容忍256 Block故障。

系统级RAID 5就是跨闪存模块使用RAID 5条带,可横跨4(2D+1P+1S)、8(6D+1P+1S)或者12(10D+1P+1S)闪存模块。

2D Flash RAID则整合VSR(闪存模块级)和系统级RAID 5技术,为每个系统提供了两个独立的RAID 5数据保护层:模块级的VSR,和系统级RAID 5。

Q5.用Flash做存储,是不是很贵?

存储贵不贵,主要有两个衡量指标:每GB成本,每IOPS成本。这需要根据具体的应用需求来衡量。

每GB成本较为适用于需要大容量存储,但访问频率不高,甚至一经写入就不再访问的应用场景,譬如备份、归档,或称之为冷存储。在这一场景下,HDD的每GB成本显然远远低于闪存存储。

每IOPS成本则适用于需要高性能、低时延的应用场景,比如在线事务处理(OLTP)。一个简单的例子,一个15000转的SAS磁盘能提供大约200 IOPS,即使是SATA接口SSD所能提供的IOPS也要高出2个数量级,而IBM FlashSystem单个2U机箱即可提供一百万的IOPS,而提供相同IOPS的磁盘系统的每IOPS成本则远远高于FlashSystem闪存系统所提供的每IOPS成本。除此之外,还有额外的空间、能源、散热以及维护成本。

Q6.什么叫软件定义存储?

根据IDC的定义,软件定义存储是能够通过一个软件堆栈交付全套存储服务的平台,利用以现成组件搭建的商用硬件,但不依赖于特定商用硬件。

在IBM看来,软件定义存储是一系列自动管理本地及全球数据的软件功能,突破性的数据存取速度、更简易的管理以及随着数据量的增加,更加快速、经济地扩展技术基础架构的能力,终极目标是还给用户管理环境的灵活性。IBM认为,软件定义存储这并不是万能的答案,与竞争对手不同,IBM强调的是针对不同的问题拿出不同的对策。

Q7.为什么需要软件定义存储?

因为在我们现有的IT环境下,很多物理设备无法做到高效的动态化,所以我们就没办法高效自动化地将相应的计算、存储、网络资源进行调配和供给。在以前,厂商都是通过传统硬件和软件之间的紧密联系,优化存储并提高性能,来解决这个问题,但是现在有了软件定义存储,就可以将软件和硬件两者分离开来,更加强调软件实现的方式,把复杂的存储系统封装成为容易操作的服务,好处就是用户可以通过一个软件或者管理界面管理自己所有的存储资源和内容。

不仅如此,从存储角度来说,仅凭纵向扩展,已经很难将单一存储系统做得更大更快,以紧耦合的方式实现大规模横向扩展,代价太高,不符合潮流。需要软件定义存储用软件解决原先硬件解决的问题,所以用户需要这种简化管理、降低复杂性的方法。

Q8.SDS(软件定义存储)是未来必然方向吗?

软件定义存储,可以说是当下瞄准了整个数据中心领域的软件定义基础设施(Software Defined Infrastructure)的一个重要支柱,是未来实现数据中心IT设备全部软件化、让数据中心具备更为强大的功能与更高的效率、更好地为应用服务的关键,可以说是未来IT领域一个重要的发展方向。

在传统企业市场,软件定义存储无疑仍处于宣传多于实质的早期阶段。一个完整的软件定义存储方案,必须摆脱对特定硬件的依赖。这主要体现在数据平面(所以分清控制平面与数据平面还是有价值的),数据平面包括存储数据的设备(如硬盘、SSD)和传输数据的通路(如SAS,FC)等硬件,也包括实现存储聚合及虚拟化等功能(如 RAID、自动精简配置、自动分层存储)的软件。

换言之,在数据平面,必须解除软件与硬件的耦合,实现软件的智能资源如果依靠特定的硬件(譬如,RAID卡提供RAID和闪存缓存/分层),那就很难分开。最后软件功能还是需要通过硬件实现。无论如何,与硬件解耦,可以通过软件(在无差异化的硬件上)实现横向扩展与较高的可用性,即我们一直都在强调的"弹性",这样的存储就可以算软件定义存储了。

作为软件定义存储领域的重要厂商之一,IBM今年推出了实现软件定义战略的重要技术——弹性存储(Elastic Storage)。弹性存储基于IBM的GPFS技术,运行在IBM自己的FlashSystem闪存阵列上。这款软件允许企业快速、自动且智能地扩展其存储需求,支持任何厂商的存储系统,允许跨多个位置的企业存储系统访问任何类型的数据。

Q9.作为SDDC技术架构的支柱,软件定义存储 如何定义资源?

首先,软件定义追求的最终目标是将设备的功能和管理性,与设备的物理性相剥离开,这样,物理设备最终只是一个执行的角色,高级的资源整合、调度与自动化协同将交给上层的软件来实现。这样做的好处就是,硬件可以更直接的服务于相关的应用,或者说应用可以更好、更直接的利用并控制IT资源,从而让数据中心具备更为强大的功能,和更高的效率,更好地为应用服务。

其次,从定义资源的角度来说,利用软件定义存储,将存储服务从底层专有硬件中抽象出来,提供更加透明的数据迁移和数据管理,这也从另一个方面降低了数据管理的复杂性,减轻数据管理的负担,使存储服务实现了简单化、虚拟化和自动化,让数据在各种存储系统和存储层,甚至是各个厂商的存储系统之间迁移和管理更加简单,让各种应用高效地运行其上,从而大大缩短了服务的交付时间。

Q10.闪存技术、软件定义存储和云存储将如何进一步发展?

单就软件定义存储来说,软件定义存储不等于更好、更强,具体方案还要看实现和成熟度。既然软件定义存储特别强调大规模横向扩展,互联网领域显然具备一定的优势。总的来看,这三个趋势并不是完全独立的,未来将相互借力地发展,其中,闪存能提高性能;云存储能加强资源整合和调用;软件定义存储能让软件更好地控制和利用IT资源,同时这三趋势与各厂商的技术和战略、企业用户现有的环境和应用的结合越来越紧密,最终目标是让数据中心更加高效。在众多主流存储厂商中,IBM将这三大趋势作为今年的战略重点,并将其作为所谓"再造存储"的基石。

Q11.IBM FlashSystem解决方案的架构是怎样的?

从技术角度来说,FlashSystem存储系统通过光纤通道SAN与异构主机平台相连接,多路径技术,从而允许通过SAN构建冗余存储链接,包括双端口FlashSystem接口连接、主机系统上的双端口主机总线适配器(HBA)、以及冗余SAN交换阵列。

从战略角度来说,FlashSystem是IBM软件定义存储战略的具体实现,可以直接添加到企业现有的业务环境之中,主操作系统可以自动发现该设备,并作为块数据存储。同时,FlashSystem也可以与IBM其他存储解决方案配合,例如SVC,可为FlashSystem提供包括自动精简配置、自动分层存储等高级功能。同时,结合IBM的Tivoli软件,能够大幅简化企业级数据中心的管理复杂度,并有效提升工作效率。

Q12.IBM FlashSystem存储系统如何加快"热"数据的处理速度?

IBM FlashSystem的快速数据存储特性将允许快速处理"热"数据——从而满足客户需求,提供最佳用户体验,同时释放处理器容量用于提供其他增值特性,闪存技术能够消除移动部件造成的延迟,实现不到100微秒的存储速度,比HDD高出50多倍。

所以,对于用户来说,他们把带有索引和结构化表数据的数据库保存在FlashSystem存储系统中,同时将其余数据保存在现有的传统硬盘阵列中以方便存取。这种层级式存储方法将允许您通过扩展来显示增加存储量,但不会影响响应时间。此外将关键应用工作负载转移到闪存系统还能消除工作负载间的资源争用问题,从而令普通应用的工作负载得以顺利运行。最重要的是,数据库中心负载量的显著增加或者根本不会影响到响应时间。

Q13.IBM FlashSystem能够给客户带来哪些价值?

FlashSystem最大的价值便是它所能带来极高的性能,这对于企业充分利用性能、可扩展性及洞察力在服务和产品市场加速发展业务是十分关键的,具体体现在3个方面:帮助构建能够加速运行关键应用并且实现真正活动市场竞争优势的数据路径;通过软硬件整合、快速部署、高效利用IT人员以及节省电力和冷却成本而实现高效率;企业级闪存与数据保护专利技术的可靠的耐久性设计。

所以总的来看,IBM FlashSystem十分注重四个方面,即性能、模块化设计、安全加密、数据管理能力,最终关注数据的经济性,帮用户降低成本。

Q14.IBM闪存系统如何改变用户对经济性的考量?

IBM闪存存储系统主要从4个方面改变数据的经济性:首先MicroLatency技术将延迟缩短到90微秒,而性能提高近45倍;全冗余、并发维护及可条带RAID做到企业级可靠性和可用性;IBM软件定义存储及5倍压缩,通过数据保护和增效技术来最大限度利用存储投资;电力和冷却成本可降低成本95%,1机架大小的场地内可以存储1PB的数据。

很多企业用户认为全闪存阵列的成本非常高,但实际上,以前我们在传统硬盘时代注重每GB成本,闪存时代则更关注每IOPS成本。按照每IOPS成本来计算的话,同等容量下,虽然闪存的成本比硬盘高出一个数量级,但它的IOPS性能却比硬盘高出两三个数量级。这样计算下来,对于需要高I/O性能的应用,闪存的成本实际上是远远低于硬盘的。因此,对于用户来说,像IBM FlashSystem这样的闪存系统在提供高性能的基础上,其每IOPS成本也是合理的,这很好地体现了它的经济性。

Q15.采用FlashSystem存储系统的OLTP解决方案由哪些组件构成?

运行IBM DB2、Microsoft SQL Server或Olracle Database等数据管理软件的数据库服务器(IBM System x或IBM Power Systems);托管整个数据集或数据子集的闪存系统(IBM FlashSystem 720或IBM FlashSystem 820);用于将数据库服务器与存储系统连接在一起的存储区域网(SAN)。

OLTP环境中使用的IBM闪存系统包括FlashSystem 720及FlashSystem 820专用外部闪存系统。这些闪存系统均能给受到保护的存储容量提供业界最高密度的单GB容量及IOPS(1U机柜空间比)并且具有低功耗特性。适用于Linx、UNIX、以及Windows的IBM DB2是用于构建强韧的企业级解决方案来处理大量工作负载的首选数据库。该产品已经优化处理,能够在交付业界领先性能的同时降低成本。而IBM System x服务器依据高标准进行开发,开发之后必须接受IBM严格的质量测试与认证,并且以IBM服务与支持为坚持后盾。

热门问题

某网友问:
V7000 1:2产品的新特性具体是什么?一般建议应用在哪些场景?

A:云计算,云存储。 应用场景: 已有存储容量满足业务发展需求,需要扩容; 需要对已有存储性能提速; 需要统一简化现有和新增所有异构存储管理; 大数据集中存储平台;

某网友问:
与V3700,DS5020,DS5300, DS4700,DS3000相比各有什么优势和劣势?

A:Storwize V7000是针对于中端以上存储系统市场的产品,使得IBM在中端以上市场能够提供给客户更多的选择,和IBM原有的中端产品线DS5000系列对比,性能指标高于DS5000,组成集群后的性能更是远高于DS5000系列存储。

某网友问:
V7000 1:2的存储市场定位是什么?主要面向哪些客户?

A:V7000 1:2市场定位是最高效的大数据软件定义存储,和上一代V7000相比实现了容量翻倍、性能翻倍、效率翻倍。由于它是一个模块化的产品,能够让容量和性能与需求同步增长,因此新一代V7000既适合小型客户也适合中型和较大的客户。

某网友问:
存储产品选型过程中需要注意什么?

A:在存储选型过程中,除了根据应用负载要求与预算来确定具体配置与型号,往往还需要避免一个误区:太过于关注存储的硬件参数指标。

这个误区容易带来两个问题:
第一、容易忽视提升存储效率的高级软件功能, 如外部存储虚拟化利旧,自动精简配置,自动分层,实时压缩等。缺乏存储效率相关高级软件,往往会导致后期运维过程中存储实际利用率低下,机房占地,供电制冷等运维成本剧增,无形中增加了总体拥有成本。

第二、容易忽视存储产品实际的性能表现,不参考第三方公开性能评测值(如存储领域性能测试权威机构SPC发布的测试值),而仅仅用一些片面的硬件参数指标来对存储产品进行选型,容易导致后期使用中存储不能达到预想的性能要求。

© 北京第二十六维信息技术有限公司版权所有.
京ICP备15039648号-7 京ICP证161336号 京公网安备 11010802021500号