新闻内容

中国航信大数据云平台的思考与实践

2012-05-08 来源:企业网D1Net关注官方微博

中国民航信息网络股份有限公司 运行中心外包服务支持部 李巍伟 中国航信大数据云平台的思考与实践

4月17日、18日在北京国家会议中心隆重举行2012 第四届CCS云计算高峰论坛暨展览。近3000名来自运营商、政府部门、金融、保险、电力、能源、医疗、公安、军队、教育、制造等行业的企业IT、信息部门主管及专家学者齐聚一堂,深度探讨云计算应用现状及发展趋势,分享交流云计算的优秀案例。60多家国内外知名厂商以云计算高峰论坛为平台展示了其最新的产品及解决方案,成为众多线上线下观众的关注焦点。

知名厂商“中国民航信息集团公司”亮相“云计算高峰论坛”并发表精彩主题演讲,其演讲主题为“中国航信大数据云平台的思考与实践”。以下是现场快递。(声明:本稿件来源为现场速记,可能有笔误和别字,仅供参考)

 

主持人:
        接下来我们将要从行业用户的角度理解云计算基础架构的建设,讲述私有云大数据平台建设的几个步骤,从宏观角度分享企业成功的最佳时间经验,下一位发言人是中国民航信息网络股份有限公司运行中心外包服务支持部李巍伟。

李巍伟:
        大家好,非常高兴有幸来到云计算这个会场,给大家分享一下中国航信对于私有云和大数据的思考与实践, 前面的嘉宾都是以厂商的角度,给我们看了一下云计算现在的发展趋势。我的主要汇报其实主要站在作为最终用 户的角度,来阐述一下中国航信在私有云和大数据整个这条道路到底是如何走下去的。
    说到走私有云这个道路,我们要看一看中国航信有什么样的需求做这样的事情,所以必须从航信的业务来开 始,中国航信整个集团,其实它的前身是在三十年前是民航总局的计算机室发展的,到了2001年的时候,2月在 香港上市了,那个时候员工可能还不到五百人,经过八、九年的发展,到目前为止整个航信全球的员工超过了四 千人。
        航信理论上的主营业务其实只有一项,他是航空旅游行业领先的信息技术及商务服务提供商,什么意思呢, 其实我相信在座的,我觉得肯定超过90%以上的同志,肯定都享受过,或者之前享受过中国航信的服务,如果大 家要去订机票的话,首先大家可能会打电话咨询一些代理,或者从某些网站查询最低票价,看到这些票价以后我 们下订单,下了订单以后,我们可能当天要去坐飞机,在去坐飞机的路上我们要通过手机在互联网上进行直击, 然后我们要行李托运,然后要安检、登机等等,其实你都是在享受中国航信后台为你做整个的服务,而这个平台 目前是一个什么样的量呢,他每秒的处理量超过了11000个TPS,日均旅客量超过了一百万,日交易额超过了10亿 人民币,而支撑整个这个规模的交易,我们目前超过了两千台的硬件设备,这些硬件设备包括网络设备、存储设 备、计算资源等等等等,超过了两个PB的存储,超过了17000的网络和光纤接入端口,我们硬件资源平均使用率 超过了62%。而这些硬件资源分布在我们现在的三个数据中心,可能是未来的五个数据中心当中。说到整个IT架 构的发展,不能不从从二三十年前开始整个航信当时的应用,可能只有一到两家公司可以提供,而作为航空领域 领先的信息服务提供商,我们当时是选用了一个大机平台,经过二十年的运转,到了1995年、1996年的时候我们 发现了一些弊端,因为随着业务不断发展,我们发现整个平台是封闭的,这个平台封闭是因为大机大部分的系统 都是他的专用系统,而不是像现在流行的开放系统,所以我们的管理人员是需要通过专门的知识进行软件开发, 进行业务的开发,而且大机本身用的是大机制的这种格式,所以想移动平台基本是不可能的,至少在当时的环境 下是不可能的,所以在用传统大型计算机的时候我们发现了很多问题,平台的封闭,管理的复杂,不易扩展等等 ,到了1995年,我的领导意识到了这个问题,虽然说当时并不是很急迫,但是那个时候就组织了很多的开发人员 ,对于大机底层的源码进行了分析,分析完了以后我们自主开发了一套接口,有了接口以后我们可以把整个大型 主机就是当时的民航数据向开放平台迁移,这些开放平台,把他的核心业务功能移到了开放平台上,可能按照功 能分到了比如像货运订座等等开放平台的系统上,但是当时我们所说的开放平台的系统,主要指的是像IBM、HP 这类的服务器,当时很少有这种X86的服务器。
        随着数据中心的快速发展,因为我们当时,应该说是现在,现在一共有三个数据中心,一个在美术馆,一个 在三里屯,另外一个在亦庄,这三个数据中心,基本上都在市区核心地带,他的电力资源,和他的空间资源是非 常非常有限的。随着我们把主机的核心功能开始向开放系统迁移的过程当中,我们的设备也开始以急速的方式增 长,那个时候我们发现我们第一个首先不够的资源是电力,我们电力一下提供不了那么多的电力以后,我们开始 对我们的业务和服务器进行梳理,我们发现我们服务器很多CPU和内存的使用率都非常小,而我说的这个服务器 其实大部分现在指的是UNIX的服务器。信息之间是无法共享的,他们本身的数据都是存在孤岛而这些孤 岛给我们的数据统一备份和管理带来了很多的困难,监控起来也非常复杂。
        06年的时候我们接触到虚拟化技术,虚拟化技术当中确实没有太多的选择,我们把他们整合起来,提高应用 的使用率,以缓解机房和电力上的使用不足。08年的时候我们开始决定做第三个机房,在此基础上,我们08年开 始向X86和虚拟化这个平台当中进行迁移,这块我可以说几点,整个迁移过程,涉及到了将近六十个业务,而这些业务耗费了我们大约将近一年总的时间才把这些完全迁移到虚拟化平台当中,但是我们所说的虚拟化的数据中 心,不仅包括了虚拟机,而且也包括了很多X86的物理实体机,在整个迁移过程当中,并不是所有服务,或者并 不是所有的应用都很适合于搞虚拟化的。为什么这么说呢?首先其实我们这个架构相当来说是比较传统的,首先 他主要是三层架构,这三层架构其实包括了应用层,包括了数据库层,也包括了Web,百分之百的Web层我们都实 现了虚拟化。另外应用系统,70-80%是可以做迁移的,另外的20-30%,也只能跑到X86,其实他并不太适合虚拟 化,我们有很多的业务,可能你会发现通过很多第三方的工具,从原有的服务器迁移到虚拟环境当中,但是在迁 移完了以后,运行一周到两周的时间,这时候业务部门的一些同事,包括开发的同事就会抱怨说,我不知道你之 前在什么平台上运行的,但是我现在感觉这个平台运行的非常慢,所以在这种情况下,我们可以和开发者,包括 业务部门,使用者进行沟通,对于整个的虚拟化参数,包括架构进行优化,有的就优化成了,有的还是不行,所 以我们大部分的,就是优化成了继续留在虚拟中心当中,优化不成的我们只能用X86承载他的业务。整个数据库 现在为止,航信90%的数据库是没有跑在虚拟化的平台当中,我们现在有20%的数据库是跑在了X86的服务器上。 目前我们也是按部就班,按照我们的计划尽量做低成本的解决方案,所以我们的数据库开始向X86迁移,70%以上 的的数据还是跑在UNIX上的。相信未来可能随着虚拟化技术不断提升,可能我们有希望能够将这些资源迁移到虚 拟化平台。
        迁移完了以后我们得到了非常好的效果,当然这个数据是之前的数据了,但是他的效果基本上一样的,就是 我们整个空间节省超过了95%,电力资源节省了95%,也就是说从08年当时我们决定要租这个第三方的数据中心以 后,经过一年的时间,我们迁移到虚拟化平台,有了虚拟化平台带给我们的这些效果,所以我们真正第三方机房 租用是从2011年开始的,给我们提供整个机房迁移的一个必要缓转的时间,我们目前整个服务器达到1:2,CPU 使用率超过了30%,内存的使用率超过了60%,为什么这块是30和60的比例,当时我们买X86服务器的时候,当时 的配比,当时内存和CPU的内比应该是1:2,或者1:4,后来我们发现大部分的使用消耗的内存更多,所以说建 议大家如果真的要做虚拟化平台,还是首先要收集一下自己应用的一些数据,这种内存比目前是1:4和1:8,从 我们现在在卖机器的角度来谈。
        另外一个就是系统部署的周期是0.5个工作日,原来是将近一周的时间,后来业务部门开发人员也会向我们 提,你们这个效率是不是可以提高一些,因为原来我们要满足随需应变的客户,航空公司,包括我们核心客户的 需求。后来我们的部署周期变成了0.5个工作日,存储数据,包括管理也实现了集中,所以管理和备份也从而实现了。
        这是中国航信当时制定的云计算发展蓝图,一共是三步走,我们可以看到08年之前,如果你管他叫1.0,2.0 的话,我之前还有一个0.5就是我们的技术储备,对于我们后期在做虚拟化整个过程当中是非常非常有利的。
        我们的第一步,可以看到虚拟化的构建,刚才我可能也谈过了,整个我的每一步其实都是有一个驱动力,虚 拟化池化的构建是源于我们的需求驱动力,也就是我们机房和电力不足,包括管理效率的提升为目的所以这是当 时的需求驱动,我们有了第一步的时候,我们可能买了将近25台四路服务器,将近400到400的应用,大家发现整 个平台的效果越来越好,所以近两年设备的登帐是非常非常快的,增长快了带来了另外一个问题,就是管理问题 ,尤其是对于这个配置的管理,因为航信管理流程有一个核心部分就是3NDB的管理,05、06年都是静态数据,后 来到了08年的时候,自己也做了一些开发,将配置管理作为自动化的发现,后来发现上虚拟化以后,这种配置的 变更就异常的活跃,所以这个配置变更也给我们带来了很多很多的挑战,所以有了像这类的挑战,包括自助式交 付挑战以后,从09年上半年直到现在,我们一直在做整个平台优化和完善的工作。
        另外在航信,因为云计算这个概念,其实在国外这个概念很早,在国内接受度也是在这两年接受的,我们公 司的本身参加过美国的会谈,所以他们本身对云计算非常看重的,所以他们制订了一个战略,也就是航信要做自 己的企业的私有云,当时的定位就是共有云理论上应该是电信运营商,他们有先天的优势,所以航信在定位的时 候,就选择了我们要做企业的私有云,而且要做行业的平台。
        整个的IaaS平台架构航信有这么一张图,我去掉了很多部分,很多部分其实并不是私有云当中的模块,所以 我就只是把简要的图放在这,我相信大部分,刚才很多嘉宾在展示图的时候都有很多类似的这种图,这个其实并 不是很重要的,关键是其中你到底是怎么做的,关键是这些模块的设计,包括资源的控制,逻辑的控制,管理和 业务。私有云安全和网络这部分相对共有云是比较简单的,这块我就舍去。关于资源这块,其实我们有传统方式 ,也有所谓的比较流行的方式,像虚拟化的计算资源。在虚拟化的计算资源这块,航信一直在尝试不同的产品, 存储这块我们也有传统的方式。使用整个这套系统的,大部分是我们的业务部门和开发部门,那么业务部门和开 发部门会存自己的一些像有些开发包括应用的维护的环境,所以这些环境都是模板,那些模板大小不一,而且数 量非常多,如果说模板存在的现有存储当中必然会造成大量的资源浪费,所以我们采用分布式的管理系统,目前 航信采用了一到两种,主要用的一种,另外还用了第二种的分布式的管理系统。在整个架构当中监控也是一个重 点,因为我们的生产系统是位于三个不同的数据中心,而三个不同的数据中心当中有两个主中心,其中还有一个 中心,到目前为止是无人值守的,如果你想实现无人值守,我们现在是测试系统可能会出现这种问题,现在我可 能还运行在比如美术馆的数据中心,那么由于监控发现了他的一些不利的条件,然后他处罚了一个故障,而有可 能这个时候就由我五四的数据中心迁移到亦庄的数据中心了,对于这种情况我们是非常头疼的,我们目前也在做 监控模块的开发,要有精准的监控也是云计算必不可少的一个环节。
        另外一个最重要的环节,就是配置管理和计费,计费在航信可能分了很多的部,从去年开始,公司就开始建 立全成本核算概念,在业务部门之间部和部之间是通过虚拟财务技术结算的,所以到底业务部门使了多少资源, 使了多少的内存,使了多少的网络资源等等,最后他要虚拟支付的,所以计费系统也非常重要,而这一部分,从这块来看,我们之前Iaas这一部分,我们是自己开发的一套软件,我只能说它是一套软件。我们在这块其实走了 一些弯路,所以我们到现在,我们就开始采用,做了很多的POC测试,关于开源产品的,但是也提供商业化的支持。所以在这块我们也不再自己做尝试做开发了。
        现在没有一套商业监控产品能够完全满足你企业的需求,要想监控做到位,必不可少肯定有开发的工作,包 括计费系统也是一样的,因为整个计费模型只有你企业内部人才能知道,所以这块的核算模型肯定是由你自己去做开发的。
        另外一个部分就是终端自服务的界面,整个这个界面,在我们调研过程当中我们发现,其实我们的运维管理 人员并不喜欢使用这个界面,运维管理人员更愿意体现自己的价值,这种价值就是他的管理的颗粒度一定要细, 而在这个界面当中其实管理的颗粒度非常小,其实我们如果用过亚马逊的EC2之类的软件,你会发现非常简单, 他这个简单就是你只要选个模板,选CPU的个数,一执行就出来了,这不是我们管理人员要看到的,整个运维团 队肯定还是使底层VC这类的工具,而不是上层的,上层的是那种对于IT运维没有太多经验的用户在使用,所以这 块开发定位上,当时我们也走了这样的弯路。我们技术实践的途径其实就是以业界成熟的开源技术方案为基础, 结合航信自身的优势和特点,自主的定制化的开发。
        说到大数据,我拿到大会邀请的时候,我看到了有大数据和云计算这两个方向,但是我觉得航信在大数据方 面的经验也有一些,所以也是拿出来跟大家一块分享。而且我觉得,大家都说云计算,一说到云计算就提到虚拟化,其实不是那个样子的,虚拟化只是云计算当中的一部分,虚拟化是一将物理机切合为多台小的逻辑机,为不 同业务提供服务,而在数据仓库平台上由于他是OLAP的系统,所以他的并行处理能力更重要,他相当于把多台机 器合成为一台机器在用,其实这也是云计算本身的一项技术。
        我们看一下航信在数据仓库平台是如何做的。99年航信迎来了开放平台发展的高峰,99年我们旅客量只有几 千万,02年的时候,旅客量就突破了一个亿了,这一个亿旅客带来了海量数据的增长,而且数据类型也是丰富多 样的,所以在那个时候,02年我们就认为整个数据挖掘是非常必要的工作,所以02年的时候经过调研,我们也采 用了专有商业软件去部署,在02年的时候,我们也建立了航信自己的数据仓库的智能分析平台,这个平台也给我 们客户带来了很多的价值。都是同样,随着数量的增长,然后我们发现数据加载的周期越来越长,其实到数据加 载周期长并不是这套平台的缺点,其实整个平台是可以横向扩展的,为什么说加载周期长是我们的不足呢,是因 为整个他的横向扩展受制于成本的压力,他的横向扩展透出是非常非常大的,而且他只支持至少是非结构化数据 ,从那个时候开始,很多大量的互联网数据,非结构化数据也是我们业务的一个需要。所以他的不足就越发的显 现出来。
        民航局预测,2020年我们航空旅客量应该超过七亿,面复合增长超过了10%,等等这些原因造就了我们现在 ,我们要面临互联网数据的多样性的要求,海量数据的处理,非结构化数据的处理,这种高复杂性的数据处理, 而且在智能分析当中,我们要求是快速响应,面对这些挑战,我们的系统根本没法应付深层次高敏捷性的这种访 问,所以面对这些问题的时候,我们制定了一个,在数据上的发展,其实整个大数据的发展,我们也是来自于谷 歌的一些技术的启示。我们硬件平台开始向低成本的数据仓库平台,加上X86的这种,作为对于传统数据的一些 处理的平台。而我们对于非结构化数据的处理,我们将采用的是这种全开源的和X86低廉的解决方案。有人会问 ,我们为什么不这两步同时走,其实这可能跟自己的行业特点有一定的关系,因为我们对自己的运行,包括开发 的人员,技术、管理有很高的要求,就是对于这种数据库开源技术,对于这些东西都有非常高的要求,对于传统 的运维理念都有很多的突破。所以我们评估完了以后,我们觉得我们就目前的能力来讲,我们还无法做这件事, 就是和我们的低成本数据仓库并行来做这个全开源的产品,目前我们还没有这种能力。
        我们未来的框架就是像静态数据和传统的结构化数据,我们还是依赖可靠性,可管理性的这些特点,定制化 的开发我们商业智能的系统工具,对于非结构化的数据,我们利用这些灵活定制,可开发的,分布式的这种方式 ,开发我们智能分析平台。
    其实总结一句话,不管航信走虚拟化的道路,还是大数据的思考,其实只是来源于需求,大部分的应用,大 部分的技术变革,都是来源于自身或者说是客户行业带给你的需求。有一句话大家也经常说,在私有云上,不要 为了化而去云化,我也很认为这个观点。有很多企业为了达到一定的高度去上一些应用,我觉得得不偿失,因为 航信也走过类似的弯路,在这里建议大家一定要从自身企业的需求去考虑。
        航信其实已经有了三十年的服务经验,也是中央企业唯一一个从事信息服务的企业,并且有着标准化的服务 产品,所以这是我们的使命感和社会责任感更加的增强。所以我们为了社会的服务,我们打造了面向社会公众信 息服务平台,提供很多服务,在这里不一一介绍了,非常感谢大家。
   
主持人:
        谢谢李总的精彩分享。
        今天上午的演讲到此结束,下午数据中心专场欢迎大家参与。

(责任编辑:com198 )
:关键词:大数据
分享到: 0

展会早知道

输入电子邮箱,了解最新展会动态:

CIO-CRM-ERP-IM-IPV6-IP电话-IP语音-OA-UC-VPN-安全-测试-存储-电源-多媒体通信-服务器-呼叫中心-交换机-联络中心-路由器-企业通信-企业网-企业信息化-企业业务-企业应用软件-渠道商-融合通信-视频会议-视频监控-数据通信-数据中心-统一通信-网真-协作--虚拟化-移动办公-应用交付-远真-运营商-运营商政企/集客业务-增值业务-智真-IAAS-PAAS-OA-ERP-容灾备份-Virtualization-虚拟化-大数据-公有云-混合云-云安全-云平台-云应用-绿色IT-运营商政企/集客业务-物联网-移动互联网