参加EMC World 2014这样的大会,最头疼的就是中国人碍于面子去搞美式社交,简直是时间杀手,间接导致严重缺乏睡眠。
好吧,其实我想说……昨晚空腹喝了罐啤酒(“美式社交”,你懂的),回到房间就倒下了,今早才挣扎着爬起来。
还好,现在谈谈我对EMC World 2014上主要产品/技术发布的感受,应该也不算晚。
第一天在产品技术方面,有五个重大发布,都冠以“Re-defined”以切大会的主题,包括4个“重新定义了的”存储,1个“重新定义了的”基础设施(Infrastructure),如下:
概括一下,可以总结为一闪(存)二软(件)三平台。今天重点谈谈这个“闪”——也许有人会说,不是前两个都是闪存么,怎么才“一闪”呢?因为……真的只有一闪。
EMC World 2013时还没有GA的全闪存阵列XtremIO,主要亮点是各种打击竞争对手,包括持续到9月30日的“百万美元担保”。很典型的市场宣传行为,这样的花头就不多谈了。
EMC公司董事长乔图斯(右)宣布收购DSSD之后,与DSSD董事长Andy Bechtolheim交流——后者以投资Google的眼光和回报而为大众所知,也为DSSD赚取了一些知名度
差点闪瞎一地相机的是乔图斯在大会上亲自宣布,EMC收购闪存初创公司DSSD。这家成立已四年的公司还没有产品,遑论客户,官网上更是只有一个Logo和联系邮件地址。国内媒体的朋友们对DSSD的核心团队成员津津乐道,一是因为这些人确实有来头,二也是因为除此之外,公开信息少得可怜。
这点倒很容易让人想到去年EMC World上的XtremIO。当时也是还没有正式的产品和客户,不同之处是,产品已经基本成型了,多少有一些技术和功能特点的资料放出来,不至于盲人摸象。
DSSD公司的总裁兼董事长Bill Moore之前是Sun的首席存储工程师,还共同领导过ZFS文件系统的设计和开发团队。帮助成立过3PAR,2010年起成为Nexenta Systems技术咨询委员会的成员——后者被一些人认为是软件定义存储的代表性厂商之一。
共同创始人Jeff Bonwick以领导ZFS文件系统的开发团队而知名,当然Sun院士及副总裁的名头也够响。
看起来软件背景够强,但以前为数不多的报道里也有说,他们在开发一种机密的芯片。还有就是列举他们拥有的一堆专利,不过这个有点欠缺说服力——大浪潮还有一面专利墙呢,虽然专利和专利也不一样吧……
无论是6位核心团队成员上台面对产品和技术方面的问题,还是EMC展出的对比资料,态度都是——没得说!?
和闪存又有什么关系呢?Bill Moore在硬件和软件设计上都有很深的造诣,是Sun服务器团队的关键成员,成功开发了SunFire服务器产品线,而SunFire是较早采用PCIe(PCI Express)闪存卡的,并且不是简单的OEM。
有人打听到,其他核心成员中有人来自IDT(Integrated Device Technology)。这个没查到,倒是DSSD负责战略联盟的VP在IDT和Intel都干过。最早支持NVMe的PCIe闪存控制器就来自IDT,这部分业务去年售予了PMC-Sierra。
怎么听都有点儿牵强,还是看看EMC给DSSD的定位吧:服务器端闪存,机架规模(Rack Scale),强调低延迟,面向内存数据库、实时分析、高性能数据分析等应用。
注意DSSD与服务器闪存(PCIe卡)的相对位置,DSSD延迟更短(性能更高),并具有相对多的数据服务,以解决PCIe闪存卡(因分散在各服务器中直连存储而)不易管理、容量有限,以及专有API等弊端
注意这个机架规模是相对数据中心规模、云规模而言的,即不是很强分布式的场景,所以也不大可能以大规模分布式软件系统为核心竞争力。再说这方面EMC已经有了ScaleIO,虽然并不是专为闪存设计的软件。
DSSD的扩展能力相比数据中心和云还是较为有限的,规模本来也不是其首要目标
服务器端闪存,以EMC的习惯,通常是指PCIe闪存卡。有没有可能是其他选择呢?
缩短闪存的延迟,可以分成两种方法。一种是硬件的,即缩短与CPU之间的距离,譬如(原生,非桥接)PCIe闪存卡就比SAS/SATA快,尤其是现代CPU已普遍集成了PCIe(最新的例子是POWER8)。理论上把闪存放到内存槽延迟更短,如SanDisk的ULLtraDIMM,我最初与同行们分享的就是这种想法。
不过,这样的话貌似没有什么独特性,而且很难想到别的花样。一帮软件背景很强的大牛,折腾了三四年这么偏“硬”的东西还没有成品,EMC的眼光也不至于这么差。
于是,软件方式的想法渐渐占了上风。
当然,有句话要说在前面,软件和硬件本来就不是截然分开的,很多时候只是侧重问题,相互间往往是互相配合的关系。譬如刚提到的ULLtraDIMM,是不一样的硬件实现,也需要软件(固件、操作系统)支持;而要追求极致性能,就很难做到硬件无关。
Google上可以找到2013年Bill Moore在一个HPC会议上的演讲,仍然没有很明确的信息,但有些可以猜测的东西。
首先,在为数不多提到硬件的部分,一个不起眼的角落里,可以看出Bill Moore紧跟时代的步伐,软硬双修不是盖的;
其次,一个可能的方向是,精简I/O软件栈?貌似精简I/O堆栈近来很时髦,像硬盘厂商希捷(Seagate)就在推动以太网硬盘Kinetic,简化架构、降低成本,提高扩展能力。不过DSSD这个出发点应该不同,像是要将缩短延迟作为目标。如Moore出示的数据,操作系统层25微秒(μs)的延迟对以毫秒(ms)计的硬盘而言不算什么,而延迟可以在100微秒以内的PCIe闪存卡显然就不同了。如果在驱动程序(如NVMe)等方面取得突破,打破POSIX API的限制,必要时加上硬件的配合,应该会有不小的收获。
现代PCIe闪存卡的延迟可以缩短到100μs的级别,降低OS层的开销就更加重要
第三,像RDMA、IB(InfiniBand)、RoCE等降低网络访问延迟的技术也被提及,解决机架级别的规模是没问题的,像Oracle的Exadata数据库一体机,是应用InfiniBand的代表性产品,可以扩展到18个机架。比单服务器PCIe闪存卡的规模当然要大很多,但仍然是机架规模,而不是数据中心规模。
Exadata是不是EMC的目标?可以肯定,这点我在下一篇文章中也会提到。至于DSSD,Bill Moore等人明确表示,产品要到2015年才能推出。在此之前,能得到多少进一步的资料,就很难说了……
好文章,需要你的鼓励
关注IT支出的朋友可能发现一个悖论:用于支持生成式AI的基础设施开销正在迅速提升,英伟达收入与利润两路狂飙的现实已经清楚证明了这一点。然而数据中心硬件层面的总支出并没有发生太大变化,且目前来看支出的主要增长点将集中在服务领域,其更多是为了减轻其他类型的工作、而非指望生成式AI独力支撑起销售预期。
一种基于人工智能(AI)的新策略正显著加快为帕金森病发现潜在新药的速度。这项发表在《自然化学生物学》杂志上的研究,可能意味着帕金森病新疗法将更快进入临床阶段并与患者见面。
如今的医生们仍背负着很多沉重且劣质的技术债务,这些技术不仅没有积极作用、甚至不能算是有价值的资产。我们绝不能让这样的情况重演,特别是不能在AI时代下重演。为此,美国医学会于2023年11月发布了一套AI开发、部署与使用原则,旨在回应我们从医生和公众那里收集到的担忧和疑虑。