参加EMC World 2014这样的大会,最头疼的就是中国人碍于面子去搞美式社交,简直是时间杀手,间接导致严重缺乏睡眠。
好吧,其实我想说……昨晚空腹喝了罐啤酒(“美式社交”,你懂的),回到房间就倒下了,今早才挣扎着爬起来。
还好,现在谈谈我对EMC World 2014上主要产品/技术发布的感受,应该也不算晚。
第一天在产品技术方面,有五个重大发布,都冠以“Re-defined”以切大会的主题,包括4个“重新定义了的”存储,1个“重新定义了的”基础设施(Infrastructure),如下:
概括一下,可以总结为一闪(存)二软(件)三平台。今天重点谈谈这个“闪”——也许有人会说,不是前两个都是闪存么,怎么才“一闪”呢?因为……真的只有一闪。
EMC World 2013时还没有GA的全闪存阵列XtremIO,主要亮点是各种打击竞争对手,包括持续到9月30日的“百万美元担保”。很典型的市场宣传行为,这样的花头就不多谈了。
EMC公司董事长乔图斯(右)宣布收购DSSD之后,与DSSD董事长Andy Bechtolheim交流——后者以投资Google的眼光和回报而为大众所知,也为DSSD赚取了一些知名度
差点闪瞎一地相机的是乔图斯在大会上亲自宣布,EMC收购闪存初创公司DSSD。这家成立已四年的公司还没有产品,遑论客户,官网上更是只有一个Logo和联系邮件地址。国内媒体的朋友们对DSSD的核心团队成员津津乐道,一是因为这些人确实有来头,二也是因为除此之外,公开信息少得可怜。
这点倒很容易让人想到去年EMC World上的XtremIO。当时也是还没有正式的产品和客户,不同之处是,产品已经基本成型了,多少有一些技术和功能特点的资料放出来,不至于盲人摸象。
DSSD公司的总裁兼董事长Bill Moore之前是Sun的首席存储工程师,还共同领导过ZFS文件系统的设计和开发团队。帮助成立过3PAR,2010年起成为Nexenta Systems技术咨询委员会的成员——后者被一些人认为是软件定义存储的代表性厂商之一。
共同创始人Jeff Bonwick以领导ZFS文件系统的开发团队而知名,当然Sun院士及副总裁的名头也够响。
看起来软件背景够强,但以前为数不多的报道里也有说,他们在开发一种机密的芯片。还有就是列举他们拥有的一堆专利,不过这个有点欠缺说服力——大浪潮还有一面专利墙呢,虽然专利和专利也不一样吧……
无论是6位核心团队成员上台面对产品和技术方面的问题,还是EMC展出的对比资料,态度都是——没得说!?
和闪存又有什么关系呢?Bill Moore在硬件和软件设计上都有很深的造诣,是Sun服务器团队的关键成员,成功开发了SunFire服务器产品线,而SunFire是较早采用PCIe(PCI Express)闪存卡的,并且不是简单的OEM。
有人打听到,其他核心成员中有人来自IDT(Integrated Device Technology)。这个没查到,倒是DSSD负责战略联盟的VP在IDT和Intel都干过。最早支持NVMe的PCIe闪存控制器就来自IDT,这部分业务去年售予了PMC-Sierra。
怎么听都有点儿牵强,还是看看EMC给DSSD的定位吧:服务器端闪存,机架规模(Rack Scale),强调低延迟,面向内存数据库、实时分析、高性能数据分析等应用。
注意DSSD与服务器闪存(PCIe卡)的相对位置,DSSD延迟更短(性能更高),并具有相对多的数据服务,以解决PCIe闪存卡(因分散在各服务器中直连存储而)不易管理、容量有限,以及专有API等弊端
注意这个机架规模是相对数据中心规模、云规模而言的,即不是很强分布式的场景,所以也不大可能以大规模分布式软件系统为核心竞争力。再说这方面EMC已经有了ScaleIO,虽然并不是专为闪存设计的软件。
DSSD的扩展能力相比数据中心和云还是较为有限的,规模本来也不是其首要目标
服务器端闪存,以EMC的习惯,通常是指PCIe闪存卡。有没有可能是其他选择呢?
缩短闪存的延迟,可以分成两种方法。一种是硬件的,即缩短与CPU之间的距离,譬如(原生,非桥接)PCIe闪存卡就比SAS/SATA快,尤其是现代CPU已普遍集成了PCIe(最新的例子是POWER8)。理论上把闪存放到内存槽延迟更短,如SanDisk的ULLtraDIMM,我最初与同行们分享的就是这种想法。
不过,这样的话貌似没有什么独特性,而且很难想到别的花样。一帮软件背景很强的大牛,折腾了三四年这么偏“硬”的东西还没有成品,EMC的眼光也不至于这么差。
于是,软件方式的想法渐渐占了上风。
当然,有句话要说在前面,软件和硬件本来就不是截然分开的,很多时候只是侧重问题,相互间往往是互相配合的关系。譬如刚提到的ULLtraDIMM,是不一样的硬件实现,也需要软件(固件、操作系统)支持;而要追求极致性能,就很难做到硬件无关。
Google上可以找到2013年Bill Moore在一个HPC会议上的演讲,仍然没有很明确的信息,但有些可以猜测的东西。
首先,在为数不多提到硬件的部分,一个不起眼的角落里,可以看出Bill Moore紧跟时代的步伐,软硬双修不是盖的;
其次,一个可能的方向是,精简I/O软件栈?貌似精简I/O堆栈近来很时髦,像硬盘厂商希捷(Seagate)就在推动以太网硬盘Kinetic,简化架构、降低成本,提高扩展能力。不过DSSD这个出发点应该不同,像是要将缩短延迟作为目标。如Moore出示的数据,操作系统层25微秒(μs)的延迟对以毫秒(ms)计的硬盘而言不算什么,而延迟可以在100微秒以内的PCIe闪存卡显然就不同了。如果在驱动程序(如NVMe)等方面取得突破,打破POSIX API的限制,必要时加上硬件的配合,应该会有不小的收获。
现代PCIe闪存卡的延迟可以缩短到100μs的级别,降低OS层的开销就更加重要
第三,像RDMA、IB(InfiniBand)、RoCE等降低网络访问延迟的技术也被提及,解决机架级别的规模是没问题的,像Oracle的Exadata数据库一体机,是应用InfiniBand的代表性产品,可以扩展到18个机架。比单服务器PCIe闪存卡的规模当然要大很多,但仍然是机架规模,而不是数据中心规模。
Exadata是不是EMC的目标?可以肯定,这点我在下一篇文章中也会提到。至于DSSD,Bill Moore等人明确表示,产品要到2015年才能推出。在此之前,能得到多少进一步的资料,就很难说了……
好文章,需要你的鼓励
这项研究由浙江大学、复旦大学等机构联合完成,提出了ReVisual-R1模型,通过创新的三阶段训练方法显著提升了多模态大语言模型的推理能力。研究发现优化的纯文本冷启动训练、解决强化学习中的梯度停滞问题、以及分阶段训练策略是关键因素。ReVisual-R1在各类推理基准测试中超越了现有开源模型,甚至在某些任务上超过了商业模型,为多模态推理研究开辟了新途径。
这项研究提出了一种名为"批评式微调"的创新方法,证明仅使用一个问题的批评数据就能显著提升大语言模型的推理能力。研究团队对Qwen和Llama系列模型进行实验,发现这种方法在数学和逻辑推理任务上都取得了显著提升,平均提高15-16个百分点,而且只需要强化学习方法1/20的计算资源。这种简单高效的方法为释放预训练模型的潜在推理能力提供了新途径。
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。