怪不得这几日净是关于大数据的新闻,原来Structure Data 2014召开了,众多数据分析领域的大佬们都亲临会场,看来大数据要继续“火”……
Wikibon:增长58%,2013大数据揽入186亿美元
据第三方研究机构Wikibon发布的报告显示,2013年,全球大数据市场总收入达186亿美元,相比于2012年,增加了58%,其中硬件、软件和服务所产生的收入占比分别为38%、22%和40%。
在这报告中,2013年大数据市场营收前三强分别为IBM、HP和Dell,SAP、Teradata、Oracle和SAS紧随其后,Pivotal未进前10,仅排名12位;思科与Splunk分别排名13与14,微软第15。亚马逊(排名16)和谷歌(排名20)这两大互联网公司在这一市场的收入超过了NetApp(排名22)、Intel(排名23)和EMC(排名24);红帽未进前30。
Wikibon预计2014年大数据市场的总收入将达到285亿美元,继续保持超过50%的增长速度;到2017年,其市场总收入将攀升至500亿美元。在这之中,服务将逐渐成为营收主力。
原文地址:
http://wikibon.org/wiki/v/Big_Data_Vendor_Revenue_and_Market_Forecast_2013-2017
众大佬现身Structure Data 理性投资大数据
Structure Data 2014大会开幕,众多数据分析界的大佬现身,譬如Pivotal公司CEO Paul Maritz。他认为,大数据分析将发挥其越来越重要的作用,将横跨所有产业群,从农业到航空,再到医学等其他行业。越来越多的公司投入其中,高性能的实时分析能够成为企业商业决策的有力支撑,但利用现有的IT系统很难做到实时分析。
也许Paul Maritz在暗示Pivotal公司未来的发展方向。当然,Pivotal并不是唯一的选择,比如提供企业版Hadoop的Hortonworks公司也对这一市场充满了野心。其CEO Rob Bearden在会上宣称,到2017或2018年,Hortonworks将成为一个年收入过10亿美金的公司。
这在开源界并非没有先例,比如红帽在2012年就年收入过10亿了。谁将成为第二个依靠开源而年收入过10亿的公司,我们还是比较期待的。
尽管大数据比较火,但是对于创业者来说,可能并不是好事情,一是因为竞争。二是因为投资者在大数据方面的投资已趋于理性。来自Bloomberg Beta投资基金的Shivon Zilis和其他投资者提醒创业者,不要试着用流行词汇来糊弄他们。当然他也透露了投资人比较看好的创始人团队组合:其一对特定行业有深入了解,另一个则有专业的技术背景。
原文链接:http://gigaom.com/2014/03/19/structuredata-2014-live-coverage/
SolidFire发布新Elements操作系统 增强全闪存阵列实力
SolidFire发布了代号为“Carbon“的全闪存阵列操作系统——Elements v6.0。据称这是一款既可以用于云数据中心,也可用于传统企业级数据中心的全闪存阵列操作系统。
这款新的操作系统增加了对16Gb FC和10GbE iSCSI的同时支持;提供不依赖第三方软、硬件的实时复制功能,单个集群可与其他四个集群配对,并在任意两个集群间进行数据复制;单个集群最小5个节点,支持非对称横向扩展,并能根据性能和容量资源分隔成多个逻辑资源池。提供基于快照的备份与还原,集成Amazon S3和OpenStack Swift API,可直接与任意对象存储或设备兼容。
提供FC支持能够让其进入企业级数据中心市场,并与现存设备兼容。其所内嵌的备份与还原功能则可绕开实际环境内需要第三方复制、备份系统支持的问题。
原文链接:
http://www.theregister.co.uk/2014/03/19/solidfire_solidifies_cloud_and_enterprise_creds/
SPEC组织为高性能计算领域发布SPEC ACCEL测试软件
SPEC(Standard Performance Evaluation Corporation,标准化性能测试公司)目前为HPC高性能计算领域发布了ACCEL的第一个软件版本。ACCEL应该是Accelerator加速器的意思。SPEC ACCEL用于测试带有硬件加速器的基于OpenCL和OpenACC的大规模并行计算系统。SPEC ACCEL检验整个系统的CPU组件、内存到加速器的传输带宽、支持库、驱动以及编译器的性能。
目前,SPEC ACCEL包含了19个OpenCL应用和15个OpenACC应用,它们都来自于典型的高性能应用程序。未来SPEC ACCEL还会加入对OpenMP 4.0的支持。
原文链接:
http://www.theregister.co.uk/2014/03/19/spec_puts_forward_benchmark_for_accelerated_supers/
好文章,需要你的鼓励
这项研究由浙江大学、复旦大学等机构联合完成,提出了ReVisual-R1模型,通过创新的三阶段训练方法显著提升了多模态大语言模型的推理能力。研究发现优化的纯文本冷启动训练、解决强化学习中的梯度停滞问题、以及分阶段训练策略是关键因素。ReVisual-R1在各类推理基准测试中超越了现有开源模型,甚至在某些任务上超过了商业模型,为多模态推理研究开辟了新途径。
这项研究提出了一种名为"批评式微调"的创新方法,证明仅使用一个问题的批评数据就能显著提升大语言模型的推理能力。研究团队对Qwen和Llama系列模型进行实验,发现这种方法在数学和逻辑推理任务上都取得了显著提升,平均提高15-16个百分点,而且只需要强化学习方法1/20的计算资源。这种简单高效的方法为释放预训练模型的潜在推理能力提供了新途径。
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。