本月早些时候,参加了一年一度的数据库大会。第二天上午在内存数据库分会场,新浪讲完他们的应用,第二场是SAP HANA,立时空出来一些座位。我知道相邻的数据库架构分会场应该是“PCIE SSD在数据库优化中的应用”,决定过去探探究竟。
个人感觉,数据库大会与同门的系统架构师大会有一个共同点,即大型用户如互联网巨头现身说法,分享应用经验最受欢迎;其次热门开源软件技术,再次Oracle、SAP等知名商业软件公司,最差就是硬件厂商讲自家产品。我要看的这场演讲,主讲人来自一家名为上海宝存(Shannon Systems)的厂商,不仅最好的可能性没有,简直就是不容乐观。
不料,竟然座无虚席,几乎站到门口。
与如此热烈场面相映成趣的,是正讲到NAND和NOR,简直是闪存的基本功!
主讲人只在最后几分钟介绍了几个PCIe(PCI Express)闪存卡的典型应用场景,大部分时间都在讲自家产品的技术架构和性能优势,听众却没见少。
似乎只能理解为,这些数据库开发者和用户们知道闪存可以大幅度提高数据库应用的性能,但苦于对相应的技术和产品缺乏足够的了解。
演讲中另一个让我有穿越之感的时刻是,对比Host-based与Device-based两种PCIe闪存卡架构。这种场景一度常出现在国内知名PCIe闪存创业公司Memblaze(忆恒创源)的宣传中,行业开拓者Fusion-io的Host-based架构因把FTL(Flash Translation Layer,闪存转换层)放到内存中由主机CPU管理而成为反面典型。
Fusion-io表示,其交给主机(CPU/内存)处理的是虚拟存储层(VSL),而不仅仅是“闪存转换层”(FTL),具备自我修复的NAND管理,可纠正位、块和裸片层面的数据错误,处理过早的块耗损,修复意想不到的坏块和裸片……等作用
不过,在这里,Host-based是正方。出了会场,听人八卦,“与Fusion-io相似的架构”让他们大大降低了教育用户的成本(纯转述,不代表本人观点)。
套用我国文艺界常用的词,这可以算是对“前辈”的一种“致敬”吧。不管被“炮轰”还是“致敬”,都是业内地位的象征。
问题是,被“致敬”的“前辈”还在业内打拼呢,就算领到“终身成就奖”,又不能当饭吃。
不过,梳理“前辈”Fusion-io所面临的各方面挑战,倒是有助于我们进一步审视企业级PCIe SSD市场。
留意下本文标题的前半部分,以Fusion-io为代表的厂商很少称自己的PCIe闪存产品为“PCIe SSD”,而是“PCIe闪存卡”、“应用加速卡”这样的称呼。因为咬文嚼字的话,SSD里面的D代表Drive,即驱动器外形、SAS或SATA接口——简单的说,看起来像硬盘。与PCIe接口相比,SAS/SATA接口带宽低、延迟长,Fusion-io显然不屑与它们为伍。
当然,PCIe接口的延迟优势,前提得是原生(Native)方案,像LSI Nytro家族那样采用SAS控制芯片桥接(Bridge)几个SATA SSD模块的做法,也是Fusion-io所不齿的。
且不论桥接方案的差距有多大,很多时候竞争态势不仅取决于技术架构。
相较于普通的数据库开发者或用户,需要高I/O性能的互联网巨头们对闪存技术的了解,显然有点过分了。Fusion-io成功IPO,加起来贡献了一半多收入的苹果和Facebook帮助吸引了很多眼球,而国内的腾讯、阿里、京东也是其用户。不过,随着这些用户大量采用PCIe闪存卡,他们意识到不能过于依赖单一供应商。
谁适合当这个“备胎”?必须得是靠谱青年啊。PCIe闪存卡市场上的大部分供应商都是初创企业,难以保证大规模的稳定供货。Intel SSD 910架构比LSI Nytro还怪异(LSI SAS控制芯片桥接SAS SSD模块),比较拿不出手,业务重点也暂不在此。看来看去,还就是LSI满足条件!于是乎,LSI Nytro也颇多斩获,据说在Facebook已不输Fusion-io……
传统OEM市场上,Fusion-io也遭到了LSI的偷袭。大服务器厂商HP、Dell都是Fusion-io的OEM客户,但LSI抓住了Oracle Exadata数据库一体机的机会。Oracle收购Sun之后,抛弃了HP的硬件,推出的第二代Exadata集成了Sun闪存加速卡F20,从而由数据仓库(OLAP)扩展到了数据库(OLTP)应用。可能因为F20就是基于LSI芯片的桥接方案(SATA SSD模块采用Marvell控制器),有助于Oracle接受Nytro,便从Exadata X2一直用到最新的X4,成长潜力不容低估。
从性能、容量、成本等角度来衡量,严格意义上的SSD经常被用作PCIe闪存卡的廉价替代品,譬如Oracle“缩水版”的数据库一体机ODA(Oracle Database Appliance),采用SAS SSD保存Redo日志;或者是不适合PCIe闪存卡做的事,譬如搜狐以Intel的DC S系列SATA SSD替换硬盘RAID 5作为系统盘,降低故障率,提高硬盘的利用率(全部用来保存数据)。从企业级市场的总体份额来看,SATA还大于SAS与PCIe之和,英特尔只靠SATA SSD就可以活得很滋润。
然而PCIe蕴含着更多的可能性。往小处说,LSI的Nytro XP6200系列可以划出一个用于引导的分区(不占用任何驱动器舱位),支持旧式(Legacy)BIOS和UEFI两种模式,其相对落后的架构反而成为一种优势;往大处说,随着SFF-8639接口的出现,PCIe闪存产品能够以驱动器的形式(SSD)存在,与SAS/SATA共享背板,不仅解决了传统PCIe插卡不便维护的问题,还降低了用户选择的门槛,更容易走向普及。
SFF-8639规范在SAS/SATA连接器的基础上加入了PCIe x4的引脚,从而让PCIe能与SAS、SATA使用统一的驱动器背板,便于前端维护
Intel和LSI都在积极准备基于SFF-8639接口的产品,Fusion-io也早在IPO之前就开展了相关的工作,很难想象它错过这个代表着未来的机会。当然,在协议的选择上,SCSI Express与NVMe还将有一番争斗。
正如前面多次提到的,除了产品和技术,正确的市场和销售策略也很重要。近半年来,原来博科(Brocade)的全球销售副总裁Ian Whiting和亚太区副总裁Charlie Foo先后加入Fusion-io,分别担任全球销售市场总监和亚太及日本区(APJ)副总裁。Ian Whiting具有丰富的OEM和渠道经验,Charlie Foo对中国市场的熟悉也是一笔宝贵的财富。今年初,Fusion-io与联想达成OEM协议,将其ioMemory解决方案应用于联想在中国区的ThinkServer系统。无论如何,市场需要Fusion-io充分展现出应有的活力。
Fusion-io大中华区总经理张子西(左上)、Fusion-io全球运营执行副总裁Ian E. Whiting(右上)、亚太与日本地区副总裁Charlie Foo(右中)和Fusion-io总裁兼首席运营官Lance L. Smith(下)
PCIe与SSD在形态上的模糊将把Fusion-io、Intel、LSI等闪存解决方案提供商的竞争导向一个新的阶段,谁能在一片混沌中脱颖而出?
好文章,需要你的鼓励
这项研究由浙江大学、复旦大学等机构联合完成,提出了ReVisual-R1模型,通过创新的三阶段训练方法显著提升了多模态大语言模型的推理能力。研究发现优化的纯文本冷启动训练、解决强化学习中的梯度停滞问题、以及分阶段训练策略是关键因素。ReVisual-R1在各类推理基准测试中超越了现有开源模型,甚至在某些任务上超过了商业模型,为多模态推理研究开辟了新途径。
这项研究提出了一种名为"批评式微调"的创新方法,证明仅使用一个问题的批评数据就能显著提升大语言模型的推理能力。研究团队对Qwen和Llama系列模型进行实验,发现这种方法在数学和逻辑推理任务上都取得了显著提升,平均提高15-16个百分点,而且只需要强化学习方法1/20的计算资源。这种简单高效的方法为释放预训练模型的潜在推理能力提供了新途径。
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。