新闻内容
华为云计算基础架构优化设计

华为 云计算营销主管 严旭东 华为云计算基础架构优化设计
2012 第四届CCS云计算高峰论坛暨展览吸引了近3000名来自运营商、政府部门、金融、保险、电力、能源、医疗、公安、军队、教育、制造等行业的企业IT、信息部门主管及专家学者积极参与,深度探讨云计算应用现状及发展趋势,分享与交流云计算的优秀案例。该盛会于4月17日、18日在北京国家会议中心隆重举行,60多家国内外知名厂商以云计算高峰论坛为平台展示了其最新的产品及解决方案,成为众多线上线下观众的关注的焦点。
知名厂商“华为”亮相“云计算高峰论坛”并发表精彩主题演讲,其演讲主题为“华为云计算基础架构优化设计”。以下是现场快递。(声明:本稿件来源为现场速记,可能有笔误和别字,仅供参考)
主持人:
谢谢刘总的精彩发言,接下来我们将要请出的是华为云计算营销主管严旭东。他将为我们介绍华为针对云计 算的基础设施,包括服务器、存储、云操作系统的优化和增强设计,以更好的服务于云的部署,最后介绍华为云 计算的最新实现进展,掌声有请。
严旭东:
各位来宾大家早上好,下面我用半个小时的时间,介绍一下华为在云基础设施方面的一些优化。
在华为公司,云解决方案,我们在云基础设施实现当中他的短木板在什么地方。我们发现一些短木板,这个 短木板当然不是云计算所有的全部,我们主要侧重于存储还有服务器,还有整个云操作系统。另外我们的优化, 最后就是我们云计算的一些实践。
IT时代,八十年代初,从现在倒退三十年,在整个人生的格子里面差不多占了三分之一,在八十年代初我们 可以看到,当时二八六的机器,这些机器我专门查了查整个CPU的能力,当时应该是六兆这样的程度,内存当时 大概是一到四兆的内存,过了差不多将近十年左右,到九十年代初的时候,当时出现了奔腾或者586这样的系列 ,CPU主频从六兆翻到六十兆,内存容量从一到四兆翻到十六到六十四兆,整个翻了十倍。三十年,不管是CPU还 是内存,增长提升的速度将近一千倍。我们过了三十年,整个CPU和内存的技术翻了将近一千倍,其实CPU和内存 在整个发展过程当中相对来说是比较协同发展的,它的发展比例比较吻合的,我们翻过了2010年的时候,其实内 存随着CPU的技术发展,内存的发展是有所放缓的,内存是我们面临的一个问题。硬件以前是5400转,现在提升 到了15000转,容量当然也有巨大的提升。我们可以看出来,在磁盘I/O能力这块,它的发展速度也是很有限的, 对于I/O来说还涉及到计算机的网卡,它的速度具有大的提升,一个服务器他可能有几十台虚拟化的虚拟机,比 如有三十,或者五十,或者更多,在这种情况下它的网卡本身实际上一定情况来说也是制约的瓶颈,I/O在云计 算部署实施其中非常重要的一个要点。
云计算整个构建起来,在一个机房里面,我们到底会关注什么东西,其实这个地方就是绿色节能这块,随着 云计算的部署,这个概念也提得越来越多,为什么会这么关注,大家看看这个图上的数据,随着数据中心的大规 模部署,我对他有没有支撑能力,这也是非常受关注的一个点。
另外我建立这样一个大的数据中心之后,到底我怎么管理,在我们现实的IT世界里面,我们也有一个统计世 界,服务器的可靠性指标99.9974%,如果我们就按五个9来算的话,他的年平均故障率是5分钟,如果数据中心部 署了10万台服务器,他每小时基本有一台机器故障,这是理论的计算,现在也有人在说,谷歌数据中心里面,他 有很多服务器,他可能也会每小时有一台服务器发生故障,在这种情况下我到底对它进行怎么样的管理,如果在 云计算的虚拟化环境里面,每台服务器有更多的虚拟机,整个这个数据中心怎么管理?这是我们对数据中心的一 些短木板的理解,数据中心,包括云计算他的短木板远不止这些。我们这里整体上侧重这些。
下面看一下华为云计算整体解决方案,我们IT设备,服务器,存储网络等等这些设备,再往上就是虚拟化, 还有我们运营管理系统,我们整个打包现在叫云操作系统,后面我们对云操作管理系统会进行进一步的分解。上 面的应用也提供了对应用的一些支撑,我们今天这个议题主要紧扣云基础设施,针对这部分,而且刚才我们提出 的短木板,我们是怎么解决的。
第一点我们看一下机房,华为在整个机房这块也不是刚刚才进去,华为以前在全球已经交付了很多机房,我 们在整个机房的建设、设计实施方面有很多的经验。机房的设计,现在我们主要围绕UPS,包括自然冷却等等我 们都做了大量深入的探索和研究,包括我们现在有具体的部署实施包括华为在内蒙我们建设了新机房,我们用的 是双频空调,内部温度常年低于60度的时候,空调基本上不工作,达到一定程度的时候,我们全部开启空调工作 ,在这种情况下整个机房设施能效比会达到1.6。这是机房的情况。
后面一部分,针对服务器,服务器是针对一些点,我们看华为做了什么样的优化,针对虚拟化,针对云计算 。第一点我们看一下,这是一个创新,现在我们刀片部署存储能够支持到24个DMM,在存储有巨大需求的情况下 ,华为能够提供这样的解决方式。第二个服务器就是刀片服务器,现在很多刀片由于设计方面的原因,可能一个 刀片部署到是两个硬盘,华为对整个部署,主办的部署也做了大量深度的创新,我们支持四个硬盘,也是解决了 存储方面的问题。这个主要是大内存技术,我们前面说了内存是他的一个非常大的瓶颈,在内存这块,华为也是 做了非常有创新的提升,针对现在的DMM尺寸1.2英寸,华为现在做了一个大的DMM卡,做到2.2英寸,存储容量恩 翻番,而且这个容量翻番的话,可以到32个G。
前面我们主要讲的服务器的存储,再一点就是服务器的I/O能力,传统模式,针对虚拟化,虚拟化我们都知 道有管理虚拟机还有应用虚拟机,传统情况下I/O他是从上到下,他是通过管理虚拟机,有一个中转,这样的话 他线路非常长,这样对CPU的占用对效率有很大的影响。华为现在针对网卡开发了智能网卡,多队列直通技术, 针对虚拟机和网卡之间交互,不是拐弯抹角的,要跑到其他管理虚拟机上面去做处理,我可以做一个队列或者虚 拟机之间的直通。
刚才介绍了服务器,华为服务器在服务器市场已经有十年的研发和市场的渗透能力,真正对外的品牌,我们 从最近两三年开始的,阶段性的我们看到了一些成就。2010年到2011年我们服务器发布量突破了20万台,而且我 们现在服务器在运营商,在互联网这边,还有政企客户这边也得到了广泛的应用,包括在互联网厂商这边,包括人民网,在国际上华为服务器,在Facebook我们也在探讨一些服务。这是我们服务器针对云计算的优化。
第二部分就讲存储,存储对云计算的优化情况。首先我们看,这是我们针对业界的标准探索出来的一些东西 。第一点涉及到I/O的能力,在存储系统里面,存储很容易成为一个瓶颈。一套存储设备可以支持上百台的虚拟 机,我们因为端口足够多,可以省掉不必要的交换机,成本也可以得到优化。
我们在虚拟机部署的过程中,公共的部分我提取出来,差别部分我们虚拟机单独保存,整个我们就可以使存储的空间得到极大的节省。虚拟机部署复制下移到阵列侧进行,存储可以做虚拟机存储清零。
我们简单看一下华为存储的解决方案全景,今年年初业内人士都知道华为已经正式完成收购了华善,我们对 存储方案进行了大幅度的整合,针对这个方案我们针对云的部署也做了更多的优化和深度的探讨。
第三部分我们针对短板,大型操作系统部署里面,大型的云数据中心部署里面,我们怎么管理它,这里面也 涉及到我们的一些优化技术,第一点也是业界现在提的比较多的,华为也做得更深的优化措施,我们虚拟机部署 的过程中内存的优化,虚拟机分配内存的时候我是按要多少分配多少,还是使用多少分配多少,内存优化技术, 内存共享,内存交换,还有内存冒泡,可以使得内存的效率得到大幅度的提升。
沿袭了华为公司在产品解决方案设计上的传统理念,在电信领域我们原来的关键优势其实也是发挥了很好的 优势,我做解决方案,我可以做到容量尽量大,尽量稳定。云计算里面我们也包括了这样一个亮点,我们现在云 的部署里面,他的部署会分为很多集群,把虚拟机迁移到相对比较完善的单位,这个集群在业内一个集群,32个 物理服务器,或者64个网,华为现在可以做到128个服务器,后面我们会进一步优化,整个服务器可以达到1024 。
还有关键的一点自动化的运维管理,我们那么多虚拟机经常出问题到底怎么办,这个时候我们就提到自动化 运维管理,第一首先自动化部署,数据中心里面我有上百上千上万这么多的虚拟机,我怎么使他初始化,整个系 统安装起来,跑起来,这首先就是自动化的安装部署。后续通过模板优化,可以使不同的虚拟机,根据他自己的 需求,部署相关的应用。另外还有自动化的运维升级,比如一个虚拟机驱动需要升级了,需要更新了,我是一台 一台操作还是统一做,通过华为的自动化管理系统,我们也可以做到冒泡式的驱动升级方式。针对整个云计算, 云数据中心大量的服务器和虚拟机,华为提出了自动化的虚拟监控,我能提早发现问题,把问题隔离出来,这就是自动化的监控维护。
第三个部分我再简要分享一下华为的应用。其实应用也可以认为是短木板,现在在云计算的过程中,部署过 程中,他的应用模式其实也是短木板。整个2011年,华为的云计算在36个国家逐步开始部署,整个覆盖的行业包 括政府、企业相关行业我们都有案例,到2011年为止,将近十万个用户。
第一个案例,我们有个电信运营商,绿色机房的措施,绿色机房在设计中我们主要部署了模块化解决方案, 这个已经交付。第二个案例我们在一个省实现了政云,在政云这块也是云计算相对比较活跃的一块,在政府机构 ,在一个省,包括在一个地级市,他有很多这样的委办机构,每个委办,针对国家整个IT,包括云计算的要求来 说,他其实有一种非常紧迫的需求,整体建设统一的IT基础设施,上面能够部署统一的业务平台,包括信息共享 等等,这样一些信息平台可以建设起来,但是在这个平台之上每个部委可以开发他自己的应用,整个从投资、维 护、应用都会起到很大的节约成本的效果。这个案例也就是我们在一个省,通过电子办这样一个单位牵头,把整 个这个壁垒拉通,就建设了这么一个政云,华为公司在国内其他地方也在建相关的模式,包括建了之后部委是租 用还是什么方式,包括商业模式我们也做了很多的总结和探讨。
最后一个案例,去年我们从实施到完整部署,到上线运行,这是上海市北医院的案例,我们对服务器的资源 进行了相关的整合,整个实施下来之后,在整个市北医院,整个医疗系统全部都是非常绿色的办公。通过这样的 整合之后,后续随着他服务器的使用,因为在医院他还是有这种急诊的高发期,包括一些疾病的传染期,在特定 的时间段里,他通过资源池的建立,能够很好的解决这个问题。另外国家提出建设区域卫生信息化,通过这个平台,他很好的往前走了一步。
前面主要针对云计算短木板,华为的一些优化,还有华为的实施做了一些介绍,也希望后续和业界,包括使 用者,一起推动云计算更深入的发展。华为围绕所用者,围绕客户能够更好的云计算,谢谢!