大会的日程是两天,时间显得比较充裕,据主持人说以前的日程是一天,显得比较紧迫所以今年增加到了两天。会议的主题在各个层面都有所概括,大的有云系统、大数据,还有分布式数据库,以及分布式文件系统,比较小的有服务器监控等项目,下面介绍几个我比较感兴趣的部分,并没有按照演讲日程排序。
58同城的演讲标题为《私有云探索与实践》,首先介绍了云计算,以及给出了一个私有云的示意图:
几乎是全中文了,演讲后来又提到了OpenStack,作为一个开软的云解决方案,OpenStack当前可谓是万众瞩目,其中应用案例也为数不少。
大数据也是相当热门的领域,其演讲嘉宾是联通沃商店的大数据技术经理,演讲标题为《基于用户画像的大数据实例》,采用的大数据实例是通过对联通营运商和沃商店数据进行分析得到用户的“画像”,从而在如广告、游戏下载等其他应用场景为用户推荐相关的产品。演讲内容是很不错,提到了很多算法以及数学公式,但是对例子的讲解也不缺乏,如机器学习、语义分析等都有所涉及,专业性和普适性都很强。后来的提问环节也很热闹,因为到场的很多都是进行实际工作的,相关领域的人并不少。
可以看到这是比较典型的Hadoop体系,里面Spark和Storm都有用到,而HIVE和机器学习都有涉及。
阿里的兄弟的第一个分享是《走进阿里分布式数据库服务》,这是用于阿里云的分布式数据库服务,也是最近才推出的,据说当时还处于测试阶段,会免费提供给用户使用。
DRDS,Distributed RDS,也就是阿里云现在的RDS(Relationship Database Service,关系数据库)的分布式版本,可以看出和Amazon早些日子推出的Aurora有些若隐若现的联系。DRDS脱胎于Alibaba的Cobra分布式数据库引擎,并吸收了Taobao TDDL分布式数据库引擎的大量优秀经验和解决方案(TDDL支持分布式join、分布式aggregation、异步索引构建、Auto sharding以及自动扩容缩容),DRDS专门针对外部用户进行了重新设计,简化操作流程。DRDS和Aurora一样,都高度兼容MySQL的API——但不是100%实现。DRDS的特点是小表异步广播、智能push等几个技术,而对于用户来说,最大的特点应该是自动扩容缩容,例如,在容量不够的时候,可以方便地购买新的容量并加入到原来的集群既可以进行扩容。
阿里集团阿里云的同学分享了一个分布式文件系统:TFS(Taobao File System),分享的标题是《TFS架构演进》,当前TFS已经是开源产品,并会在未来和飞天系统的盘古文件系统相融合,阿里的同学应该是希望TFS能得到大家的广泛使用。
TFS(Taobao File System)是一个面向互联网服务的分布式文件系统,主要针对海量的非结构化数据。从架构上看,TFS和GFS(Google File System)有些相似,都具有Nameserver节点用来处理Metadata,不同之处在于,TFS在内部使用的时候,主要用于保存taobao的产品图片,因此很多通用文件系统具有的特性它并不具备,而GFS这面向大数据。相似的地方则是,它们都构筑在普通的Linux机器集群上,为外部提供高可靠和高并发的存储访问。因此,TFS和GFS都是集中式Metadata的分布式文件系统。随着Taobao的发展,以及阿里对TFS逐渐开放给其它应用环境的需要,TFS的架构也在慢慢发展,最新的TFS 1.4.0新增支持大文件功能。TFS目前并没有怎么考虑一致性问题,因为在Taobao内部由于应用的单一性,其问题并不复杂,如果要做成一个通用的文件系统,还要进行一些开发。
两天的分享包括了系统从上到下的内容,略微遗憾的是并没有涉及到硬件基础设施,可能这也是大众对架构师的认知:偏重软件架构。很多厂商的分享都结合了自己的应用案例,而充足的提问时间也导致了一个良好的分享氛围。
有益的大会。
好文章,需要你的鼓励
这项由浙江大学与阿里巴巴通义实验室联合开展的研究,通过创新的半在线强化学习方法,显著提升了AI界面助手在多步骤任务中的表现。UI-S1-7B模型在多个基准测试中创造了7B参数规模的新纪录,为GUI自动化代理的发展开辟了新的技术路径。
阿里巴巴联合浙江大学开发的OmniThink框架让AI学会像人类一样慢思考写作。通过信息树和概念池的双重架构,系统能够动态检索信息、持续反思,突破了传统AI写作内容浅薄重复的局限。实验显示该方法在文章质量各维度均显著超越现有最强基线,知识密度提升明显,为长文本生成研究开辟了新方向。
新加坡国立大学研究人员开发出名为AiSee的可穿戴辅助设备,利用Meta的Llama模型帮助视障人士"看见"周围世界。该设备采用耳机形态,配备摄像头作为AI伴侣处理视觉信息。通过集成大语言模型,设备从简单物体识别升级为对话助手,用户可进行追问。设备运行代理AI框架,使用量化技术将Llama模型压缩至10-30亿参数在安卓设备上高效运行,支持离线处理敏感文档,保护用户隐私。
腾讯混元3D 2.0是一个革命性的3D生成系统,能够从单张图片生成高质量的带纹理3D模型。该系统包含形状生成模块Hunyuan3D-DiT和纹理合成模块Hunyuan3D-Paint,采用创新的重要性采样和多视角一致性技术,在多项评估指标上超越现有技术,并提供用户友好的制作平台。作为开源项目,它将大大降低3D内容创作门槛,推动3D技术的普及应用。