今儿帝都天气不错,蓝天蓝天,谁一贱你就笑?
作为一个严肃的业内新闻点评栏目,我为过去一周里多次提及微软、VMware并牵连到亚马逊AWS而感到……没办法,谁让这几家近来分外活跃呢。
这不,VMware刚刚宣布,在主机托管商Carpathia的帮助下,通过了美国政府的FedRAMP(Federal Risk and Authorization Management Program,联邦风险和授权管理程序)的认证,从而可以推出基于vCHS(vCloud Hybrid Service)的vCloud政府服务(vCloud Government Service)。AWS很早就具备了FedRAMP的资质,微软Windows Azure大约在半年前加入,HP也有,而Google和Rackspace还没有。据IDC预测,今年美国联邦私有云的支出就会超过17亿美元。
作为众矢之的,AWS继续稳坐钓鱼台,由Red Hat出面宣布,其Red Hat Enterprise Linux(RHEL)现在可用于AWS GovCloud(美国区域)。微软,你在看嘛?(参见2月28日的“今日至顶”)
微软可能还真没顾得上看,新任CEO纳德拉着手重组核心团队,产品部门忙着加入社交功能。本周召开的微软SharePoint 2014大会上,微软介绍了Office Graph,并引入代号为“Oslo”的应用,借鉴社交网站的方式,加强员工协作。在这里,不要试图摆脱同事们哦!
Google也不是没有收获。默多克旗下新闻集团的澳大利亚分部抛弃了微软Outlook,将在接下来6个月内改用Google Mail和Calendar,据悉每年的许可费用约70万美元。更换的原因?应该和邓文迪发错邮件没啥关系……新闻集团在澳洲的竞争对手Fairfax Media在2012年就做了类似的事情。
玩软件的在云上这么活跃,搞硬件同样没闲着。目前硬件圈里,能博得几乎所有人认同的,大概只有SSD(固态盘)了。硬件嘛,首先拼的就是硬功夫。Nimbus Data最近发布的Gemini X系列全闪存阵列,在2U机架内提供96TB容量。单从这个密度来看没啥,Skyera去年发布的SkyEagle,1U就可以提供500TB的容量——虽说今年下半年才能GA吧。
Gemini X系列的特点在于,用24个4TB固态盘做到了这一点。目测固态盘的规格是2.5英寸,不管接口是不是PCI Express(从带宽考虑颇有可能),2.5英寸规格能提供4TB容量,是硬盘都还没做到的啊。
独立的固态盘(SATA/SAS/PCIe)厂商现在日子都不好过,全闪存阵列领域的众多初创公司却颇为活跃,混合阵列又是其中的新贵。混合阵列初创公司Nimble Storage正在准备IPO,其2014财年第四季的营收环比翻番,亏损的增长幅度只有30%,前景可期的样子。
有活力的领域,对人才也更有诱惑力。尽管IPO之后的表现有点儿麻绳拎豆腐,全闪存阵列先锋厂商Violin Memory还是从EMC挖来了Eric Herzog(企业级和中端系统部营销SVP,负责VMAX、VNX和VNXe),担任CMO和业务拓展SVP,直接与老东家的XtremIO竞争。
更值得关注的人员变动是2012年12月辞去Dell企业存储VP职务的Darren Thomas,加入Micron(美光)担任存储业务部VP。闪存大厂弄潮企业存储已是大势所趋,传统存储厂商高管的经验正是他们所需要的。
Open Networking Summit仍在举行,NEC推出了一款“控制器的控制器”产品。SDN控制器大家都很熟悉——NEC在2011年就进入了这个市场,而控制器的控制器听过的人可能就没几个。新产品的名称为UNC(Unified Network Controller,统一网络控制器),它可以控制十台OpenFlow控制器,并且它们可以分散在多个数据中心之中。
好文章,需要你的鼓励
这项研究由浙江大学、复旦大学等机构联合完成,提出了ReVisual-R1模型,通过创新的三阶段训练方法显著提升了多模态大语言模型的推理能力。研究发现优化的纯文本冷启动训练、解决强化学习中的梯度停滞问题、以及分阶段训练策略是关键因素。ReVisual-R1在各类推理基准测试中超越了现有开源模型,甚至在某些任务上超过了商业模型,为多模态推理研究开辟了新途径。
这项研究提出了一种名为"批评式微调"的创新方法,证明仅使用一个问题的批评数据就能显著提升大语言模型的推理能力。研究团队对Qwen和Llama系列模型进行实验,发现这种方法在数学和逻辑推理任务上都取得了显著提升,平均提高15-16个百分点,而且只需要强化学习方法1/20的计算资源。这种简单高效的方法为释放预训练模型的潜在推理能力提供了新途径。
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。