借力OpenStack 九州云的超融合创新

数据中心技术变革使得各种创新层出不穷,开源技术也得以异军突起。作为一种新的IT交付模式,Server SAN正逐步走向成熟,并越来越主流。九州云,作为OpenStack的拥趸者,希望利用OpenStack向下突破,进一步创新Server SAN。

编者按:第三平台的成熟正倒逼基于第二平台时期的数据中心技术进行全面革新,不仅是底层硬件,乃至中间件及上层软件,甚至连解决方案的交付模式都不断创新。例如融合基础架构产品的诞生,随着时间的推移,从服务器、网络与存储的初步融合,发展为计算存储深度融合的超融合系统。同时,数据中心技术变革也使得开源产业异军突起,例如Hadoop、OpenStack等已经成为IT业内人士所津津乐道的话题,也使得未来的IT解决方案拥有更多的想象空间。本文作者杜玉杰(九州云社区业务拓展总监、OpenStack基金会董事/TryStack执行董事)将结合当前热门的融合基础架构和OpenStack话题,详解九州云公司利用开源技术在超融合系统方面的创新尝试。(注:作者意见仅供参考,不代表ZDNet观点。本文有删改)

随着Openstack的生态环境越来越成熟,依托Openstack发展的商业公司很多,商业模式也多种多样。Openstack代表了未来数据中心云架构的一个事实标准,它的存在打破了一些原来由传统商业厂商把持产品造成的壁垒,对传统的数据中心的形态进行了重塑,这种变革将会导致一些旧有数据中心产品的衰落,也会发展出一些新的产品形态。总的来说,这种重塑朝着两个方向延伸:向上突破和向下突破,大部分商业公司把重点放在了前者,九州云则试图在后者上有所成果。

向上突破:即依托Openstack做更上层的优化整合,这是最为普遍的商业模式,它试图在面向用户的业务交互模式上进行改造,借此打造不同的云计算产品。以Openstack打造公有云是最显而易见的商业模式,因为Openstack一开始之初就以AWS为模仿对象,因此诸如HPCloud、Rackspace甚至是国内的一些小型公有云提供商,以Openstack为基础,再自定义前端用户界面、计量统计、订单管理和计费流程,以此对外提供公有云服务。另外一方面,以Openstack为基础打造私有云也是向上突破的一种商业模式,这一领域主要追赶模仿VMWare,试图通过KVM+Openstack模式替换(或者整合)既有的ESXi+vCloud组合模式,同时提供比VMware产品更为丰富的API接口和二次定制化开发可能性,来吸引客户,目前,在这一领域的公司有专注Openstack发行版的国际巨头Redhat、Mirantis ,也包括一些如Piston等一些积极跟进的Openstack专业服务提供商。

向下突破:即依托Openstack对更底层硬件进行重塑,通过更为深入的数据中心基础底层架构改造,以此为客户带来价值。向下突破的主要驱动力,来自于传统数据中心管理者对底层基础架变革的渴望,互联网公司如Google/Facebook对数据中心的改造,让数据中心管理者看到基础架构在管理简化、横向扩展和成本控制上的可能性。“计算存储融合架构”是这种数据中心底层变革的手段之一,通过虚拟化技术和分布式文件存储的配合,在通用X86服务器群集上搭建计算资源池和存储资源池,节点之间通过万兆网络连接,整个群集通过技术手段保证可用性,任何单一节点的故障,不会影响上层计算资源和存储资源的使用。群集内的资源调度具有一定自我调节能力,实现整体的资源负载均衡。通过分布式的设计,群集可以实现线性的横向扩展能力,结合自动化安装,让群集横向扩展(Scale-Out)变得非常容易。

借力OpenStack 九州云的Server SAN创新

“计算存储融合架构”这一领域已经吸引越来越多的关注,新兴公司Nutanix通过虚拟化技术和分布式存储技术,在商业领域已经取得了巨大成功。VMWare等传统虚拟化厂商也积极开发出vSAN积极应对(将本地服务器磁盘聚合到共享存储集群中),同时VMware发布EVO:RAIL也意味着其将自身业务拓展至融合基础架构领域。而九州云也希望通过开源技术“另辟蹊径”,依托Openstack及其他开源产品,尝试打造基于开源技术的“计算存储融合架构”。

回顾“融合架构”的发展,也经历了不同阶段。最初“融合架构”技术来自一些传统硬件进行组合,以一体机机柜的形态在市场上出现,这些融合架构在形态上简化了设计,但深层次的技术整合不够,很多产品“新瓶装旧酒”,只在不同产品模块整合上做了一定的优化,未带来实质性的突破和变革。新兴公司Nutanix则进行更深层次的整合,将计算与存储深度融合到一个基于x86处理器的机架服务器之中,成功实现超融合系统。九州云则试图在超融合系统的基础之上,通过以Openstack的开源框架做进一步的突破。

借力OpenStack 九州云的Server SAN创新

Nutanix是过去十年硅谷增长最快的一家IT基础设施初创公司,Nutanix拥有深厚的技术基因,据称这家硅谷“新贵”很多技术人员来自Google、Facebook等互联网公司,其在创始之初,便提出了“把类似Google的基础架构技术带给企业(Bringing Google-like Infrastructure to Enterprises)”的口号,其核心即是计算和存储的融合技术,管理简单,结合商业虚拟化平台,实现企业基础架构资源的极简管理和线性向往扩展。在短短几年时间内就获得了长足发展,一些传统的世界500强企业、新兴的网络公司都采用了这一产品。然而Nutanix也存在一定的局限性。

Openstack的出现,也更重要的是以Opestack为核心的其他开源生态系统(Ecosystem)里诸如分布式存储技术、Openstack存储插件的日渐成熟,使得“计算存储融合架构”再往前跨越成为可能。九州云希望在这一方向发力,试图依托OpenStack,对融合架构做进一步改进,以适用于企业自建私有云以及托管私有云等应用场景。

九州云这款称为“计算存储云一体机(Animbus一体机)”的产品,其设计目标是“基于Openstack和相关开源技术,打造适合企业级使用的类似Google的智能计算/存储融合架构云平台,简化数据中心管理,降低数据中心成本支出”,为实现这一目标,这一产品在设计之初就遵循以下五大原则:

• 通用原则:产品专注在软件层面的实现,对底层服务器和网络设备无特殊要求
     可以运行在通用的X86服务器上,无厂商锁定和限制
     可以运行在通用的万兆交换机网络中,对硬件交换设备无特殊要求,通过软件控制整体网络行为

• 无中心原则:系统任何节点失效都不影响整体使用,主要体现在:
     任何节点都可以成为(或接管)控制器节点
     任何节点都可以成为“存储+计算”融合节点

• 群氓智能:整体平台体现高度的智能调度和运维自动化,包括:

   任何节点出现问题,虚拟机都可以自动修复错误,保证虚拟机运行
     新增节点自动安装,加入即成为资源池的一部分,接受系统调度
     支持自动资源调度,根据策略实优化负载,实现整体资源使用均衡

• 线性横向扩展:随着设备的堆叠和扩容,计算资源池和存储资源池能够实现横向线性(或近似线性的)扩展

借力OpenStack 九州云的Server SAN创新

• 业务可用性:内置整体云平台管理界面,无需额外采购,即可拥有用户交互界面,实现开机即可用

尽管在产品形态上,Animbus一体机与Nutanix有些类似,但在内部实现上却有着诸多的不同。

首先九州云Animbus云一体机把重点放在了软件解决方案的实现,而力求底层服务器的通用性。其次以Openstack为核心,通过一系列开源软件的整合,力求在成本上更加有优势。同时在Openstack本身架构做了稳定性和扩展性上的改良,也对上层和底层都做了一些深入的优化。

借力OpenStack 九州云的Server SAN创新

九州云将重点放在了对底层的优化之上,即前文所述的“向下突破”。由于Openstack的设计初衷并没有对底层基础架构有过多关注,其设计目标也并没有把兼容融合架构作为主要方向,因此一开始九州云就对未来的产品形态做了深入研究和探讨,并定义了以下设计目标:

• 计算管理(KVM)和存储管理(GlusterFS/Ceph)能和上层Openstack更紧密集成

• 计算管理(KVM)和存储管理(GlusterFS/Ceph)在一体机上能相互隔离,协同工作

• 计算管理(KVM)和存储管理(GlusterFS/Ceph)在一体机上性能达到最优

• 计算管理(KVM)和存储管理(GlusterFS/Ceph)在整个资源池中能够智能被调度

针对以上设计目标,九州云对底层的主要技术改进:

• 融合架构下计算管理(KVM)和分布式存储管理(GlusterFS/Ceph)资源隔离:计算和存储之间由于在同一物理硬件上,因此对管理节点本身的CPU/Memory资源的使用需要做相应的限制和隔离,以免资源冲突造成整体平台性能的下降。隔离方式可以选择cgroup、KVM虚拟机和Docker。

• 融合架构下的高可用:存储级别的高可用通过分布式存储中设置多副本方式实现;计算资源即虚拟机的高可用,是在KVM基础上,结合Nova Scheduler的优化,实现多节点的虚拟机在故障发生时在宿主机节点之前的切换;Openstack控制节点做了更多的改进,每个节点上都预安装了控制节点,后端数据库放在分布式存储上面,保证了高可用,同时在某一控制节点发生故障时,可以随时启用任意节点上的控制器增加新的冗余节点

借力OpenStack 九州云的Server SAN创新

• 分布式存储监控:一体机在硬件上实现了计算存储融合,因此在监控上也需要进行更深入的集成。九州云实现了一体机的监控界面,即能够监控计算资源池状态,也能获取存储资源池信息。

借力OpenStack 九州云的Server SAN创新

• 存储读写性能优化:对底层分布式存储做了一些优化,包扩虚拟化层和底层分布式文件系统的通信优化,SSD的集成方式优化和不同大小文件的读写优化

• 融合架构组件部署自动化:实现了自动化部署,支持快速扩容

• 通用X86平台最佳实践建议:根据测试和实际使用结果,在底层X86服务器硬盘搭配、阵列卡选择和网卡配置等方面给出了最佳配置建议。

除了底层的优化之外,九州云也对中层Openstack本身和上层面向用户的交互方式做了优化。其中对中层Openstack本身的优化的目标,主要集中在如是基于最新Openstack版本提供一个更适合企业使用的稳定版本,改进包括:

• Nova Scheduler优化:在“计算存储融合一体”的架构中,如何选择合适的节点进行负载分摊变得更加重要,九州云对Openstack调度上做了一定的优化,使得资源分配更加合理

• VM高可用:实现了虚拟机的高可用,能够在物理宿主机出现故障时进行切换

• 自动化安装

• Openstack服务的高可用:实现了Nova、Glance、Cinder、Keystone、Neutron等服务的高可用。
• 补丁修复:修复了Openstack版本中的一些缺陷。

对Openstack上层的优化的目标,是让Openstack提供的资源池更好的服务于业务需要,主要的改进包括:

• 界面改进:云一体解决方案内置了一个经过优化的云管理界面,这一界面可以和Horizon界面共存,用户可以根据需求,在原生Openstack界面或是九州云经过优化后的Animbus云平台界面做一个选择;

借力OpenStack 九州云的Server SAN创新

• 流程集成:定制化的界面包含了流程模块,可以实现资源申请的审批;

借力OpenStack 九州云的Server SAN创新借力OpenStack 九州云的Server SAN创新

• 计量数据报表统计:通过整合Ceilometer数据,对数据进行视图展示,比如加入了如“成本中心”等,可以实现按照成本中心进行统计;

• 监控集成:Openstack原生平台本身监控能力上相对薄弱,一般部署的时候都会借助第三方监控平台诸如Nagios、Zabbix进行监控。这样的不足是管理员需要通过登录不同的平台才能看到监控信息。九州云的云一体机加强了Openstack本身的监控能力,集成了最基本的监控数据;

• AD集成:支持通过AD进行用户验证。

总体来说,九州云基于Openstack做了不少大胆的尝试,在一些具体细节上做了很多的改进,让Openstack在更多企业数据中心落地变得更加简单容易。我们在向下突破方面做了相当多的工作,以Openstack为核心,挖掘基础架构的改造可能性,推动数据中心底层形态上的变革,这些探索代表了未来数据中心演变的一个重要方向,传统数据中心能否借助“计算存储融合架构”,朝着架构简单、管理高效和线性横向扩展的架构往前推进一步,我们将拭目以待。

附注:

在国内Openstack领域,九州云(99cloud)是最早的专业提供Openstack服务的公司之一,其主导推动的Trystack社区为广大Openstack初学者提供了很好的Openstack学习平台,在国内有一定的知名度和影响力。九州云也是国内在社区代码的贡献度比较靠前的公司之一,它基于Openstack研发的产品有某些独树一帜的地方,可以作为很好的学习研究对象。本章内容只是抛砖引玉,通过解构一家创新公司在基于Openstack为核心的“计算存储融合架构”上的探索成果,来了解更多可以在Openstack上进行创新和变革的可能性。

来源:ZDNetCBSi企业方案解决中心频道

0赞

好文章,需要你的鼓励

2014

09/10

15:19

分享

点赞