参加EMC World 2014这样的大会,最头疼的就是中国人碍于面子去搞美式社交,简直是时间杀手,间接导致严重缺乏睡眠。
好吧,其实我想说……昨晚空腹喝了罐啤酒(“美式社交”,你懂的),回到房间就倒下了,今早才挣扎着爬起来。
还好,现在谈谈我对EMC World 2014上主要产品/技术发布的感受,应该也不算晚。
第一天在产品技术方面,有五个重大发布,都冠以“Re-defined”以切大会的主题,包括4个“重新定义了的”存储,1个“重新定义了的”基础设施(Infrastructure),如下:
概括一下,可以总结为一闪(存)二软(件)三平台。今天重点谈谈这个“闪”——也许有人会说,不是前两个都是闪存么,怎么才“一闪”呢?因为……真的只有一闪。
EMC World 2013时还没有GA的全闪存阵列XtremIO,主要亮点是各种打击竞争对手,包括持续到9月30日的“百万美元担保”。很典型的市场宣传行为,这样的花头就不多谈了。
EMC公司董事长乔图斯(右)宣布收购DSSD之后,与DSSD董事长Andy Bechtolheim交流——后者以投资Google的眼光和回报而为大众所知,也为DSSD赚取了一些知名度
差点闪瞎一地相机的是乔图斯在大会上亲自宣布,EMC收购闪存初创公司DSSD。这家成立已四年的公司还没有产品,遑论客户,官网上更是只有一个Logo和联系邮件地址。国内媒体的朋友们对DSSD的核心团队成员津津乐道,一是因为这些人确实有来头,二也是因为除此之外,公开信息少得可怜。
这点倒很容易让人想到去年EMC World上的XtremIO。当时也是还没有正式的产品和客户,不同之处是,产品已经基本成型了,多少有一些技术和功能特点的资料放出来,不至于盲人摸象。
DSSD公司的总裁兼董事长Bill Moore之前是Sun的首席存储工程师,还共同领导过ZFS文件系统的设计和开发团队。帮助成立过3PAR,2010年起成为Nexenta Systems技术咨询委员会的成员——后者被一些人认为是软件定义存储的代表性厂商之一。
共同创始人Jeff Bonwick以领导ZFS文件系统的开发团队而知名,当然Sun院士及副总裁的名头也够响。
看起来软件背景够强,但以前为数不多的报道里也有说,他们在开发一种机密的芯片。还有就是列举他们拥有的一堆专利,不过这个有点欠缺说服力——大浪潮还有一面专利墙呢,虽然专利和专利也不一样吧……
无论是6位核心团队成员上台面对产品和技术方面的问题,还是EMC展出的对比资料,态度都是——没得说!?
和闪存又有什么关系呢?Bill Moore在硬件和软件设计上都有很深的造诣,是Sun服务器团队的关键成员,成功开发了SunFire服务器产品线,而SunFire是较早采用PCIe(PCI Express)闪存卡的,并且不是简单的OEM。
有人打听到,其他核心成员中有人来自IDT(Integrated Device Technology)。这个没查到,倒是DSSD负责战略联盟的VP在IDT和Intel都干过。最早支持NVMe的PCIe闪存控制器就来自IDT,这部分业务去年售予了PMC-Sierra。
怎么听都有点儿牵强,还是看看EMC给DSSD的定位吧:服务器端闪存,机架规模(Rack Scale),强调低延迟,面向内存数据库、实时分析、高性能数据分析等应用。
注意DSSD与服务器闪存(PCIe卡)的相对位置,DSSD延迟更短(性能更高),并具有相对多的数据服务,以解决PCIe闪存卡(因分散在各服务器中直连存储而)不易管理、容量有限,以及专有API等弊端
注意这个机架规模是相对数据中心规模、云规模而言的,即不是很强分布式的场景,所以也不大可能以大规模分布式软件系统为核心竞争力。再说这方面EMC已经有了ScaleIO,虽然并不是专为闪存设计的软件。
DSSD的扩展能力相比数据中心和云还是较为有限的,规模本来也不是其首要目标
服务器端闪存,以EMC的习惯,通常是指PCIe闪存卡。有没有可能是其他选择呢?
缩短闪存的延迟,可以分成两种方法。一种是硬件的,即缩短与CPU之间的距离,譬如(原生,非桥接)PCIe闪存卡就比SAS/SATA快,尤其是现代CPU已普遍集成了PCIe(最新的例子是POWER8)。理论上把闪存放到内存槽延迟更短,如SanDisk的ULLtraDIMM,我最初与同行们分享的就是这种想法。
不过,这样的话貌似没有什么独特性,而且很难想到别的花样。一帮软件背景很强的大牛,折腾了三四年这么偏“硬”的东西还没有成品,EMC的眼光也不至于这么差。
于是,软件方式的想法渐渐占了上风。
当然,有句话要说在前面,软件和硬件本来就不是截然分开的,很多时候只是侧重问题,相互间往往是互相配合的关系。譬如刚提到的ULLtraDIMM,是不一样的硬件实现,也需要软件(固件、操作系统)支持;而要追求极致性能,就很难做到硬件无关。
Google上可以找到2013年Bill Moore在一个HPC会议上的演讲,仍然没有很明确的信息,但有些可以猜测的东西。
首先,在为数不多提到硬件的部分,一个不起眼的角落里,可以看出Bill Moore紧跟时代的步伐,软硬双修不是盖的;
其次,一个可能的方向是,精简I/O软件栈?貌似精简I/O堆栈近来很时髦,像硬盘厂商希捷(Seagate)就在推动以太网硬盘Kinetic,简化架构、降低成本,提高扩展能力。不过DSSD这个出发点应该不同,像是要将缩短延迟作为目标。如Moore出示的数据,操作系统层25微秒(μs)的延迟对以毫秒(ms)计的硬盘而言不算什么,而延迟可以在100微秒以内的PCIe闪存卡显然就不同了。如果在驱动程序(如NVMe)等方面取得突破,打破POSIX API的限制,必要时加上硬件的配合,应该会有不小的收获。
现代PCIe闪存卡的延迟可以缩短到100μs的级别,降低OS层的开销就更加重要
第三,像RDMA、IB(InfiniBand)、RoCE等降低网络访问延迟的技术也被提及,解决机架级别的规模是没问题的,像Oracle的Exadata数据库一体机,是应用InfiniBand的代表性产品,可以扩展到18个机架。比单服务器PCIe闪存卡的规模当然要大很多,但仍然是机架规模,而不是数据中心规模。
Exadata是不是EMC的目标?可以肯定,这点我在下一篇文章中也会提到。至于DSSD,Bill Moore等人明确表示,产品要到2015年才能推出。在此之前,能得到多少进一步的资料,就很难说了……
好文章,需要你的鼓励
树莓派基金会调查发现,尽管60%的家长认为编程是孩子的重要技能,但超过70%的家长表示孩子在正常课程中没有学习编程。该基金会CEO指出,随着AI技术快速发展,年轻人掌握技术理解和创造能力比以往更重要。超半数家长认为编程应成为必修课程,并相信学习编程能提升孩子未来职业前景。为填补学校教育空白,基金会呼吁在学校和图书馆广泛设立编程俱乐部,目标到2035年全球教授1000万儿童编程技能。
Patronus AI发布突破性研究,构建了首个系统性AI代理错误评估体系TRAIL,涵盖148个真实案例和21种错误类型。研究发现即使最先进的AI模型在复杂任务错误识别上准确率仅11%,揭示了当前AI代理系统在长文本处理、推理能力和自我监控方面的重大局限,为构建更可靠的AI系统指明方向。
文章介绍了AI大语言模型中最新的深度研究功能,这是目前最令人印象深刻的新功能之一。作者详细解析了ChatGPT、Claude和Gemini等主流模型的使用方法,并重点展示了深度研究功能的实际应用。通过实际测试,作者用ChatGPT 4.5的深度研究功能生成了一份关于1990-2025年最令人厌烦歌曲的详细报告,展示了AI如何通过思维链进行深度研究和分析。文章还提到了语音交互模式将进一步改变用户与AI的交互体验。
这项研究首次从理论和实践证明AI模型可通过模仿生物睡眠-学习周期显著提升性能。研究发现AI训练中存在自发的"记忆-压缩循环",并据此开发了GAPT算法,在大语言模型预训练中实现4.8%性能提升和70%表示效率改善,在算术泛化任务中提升35%,为AI发展指出了注重信息整理而非单纯数据扩展的新方向。