展会资讯 > 往届展会演讲 > 正文

触手可及的云计算

2013-05-15 16:46:34 来源:企业网D1Net关注官方微博

2013年5月15日、16日,第六届云计算高峰论坛暨展览在北京国家会议中心盛大举行,吸引了来自政府部门、金融、保险、电力、能源、医疗、教育、交通、物流、教育、制造等行业的近3000名企业IT、信息部门主管及专家学者,跨国公司在华机构,科研院所的CIO,CTO等企业IT、信息部门主管及专家学者等具有行业代表性的相关企事业单位人员积极参与。60多家国内外知名厂商以此为平台,展示了其最新的产品及解决方案,成为众多线上线下观众的关注的焦点。

今日,知名厂商北京首都在线科技股份有限公司亮相“云计算高峰论坛”,北京首都在线科技股份有限公司COO赵永志发表精彩主题演讲,主题为“触手可及的云计算”。以下是现场速递。(声明:本稿件来源为现场速记,可能有笔误和别字,仅供参考)
\

北京首都在线科技股份有限公司COO 赵永志

赵永志:谢谢大家,我刚刚来,也听了一下前面两位介绍,看了会议日程,这么大会场已经走不少人了。我讲完了之后是一个抽奖,一等奖是IPAD,大家坚持到现在,再坚持一下听我讲完首都在线触手可及云计算。

大家听一下午,云计算因为牵扯层面比较多,牵扯应用比较多,应用层面到平台层面和首都在线做的层面每层面用户不同。下面这么多听众,我不敢肯定所有听众对我讲部分有兴趣。首都在线就是我今天介绍这部分云计算主要是针对于基础构架云计算部分,这个部分已经为我们客户带来非常大的成本节约和高效运行,我后面案例里也给大家介绍到具体客户案例,非常激动人心的。

云计算是什么?其实每一个体系里理解都不一样,在我们今天看来,首都在线从98年开始从事数据中心业务,从数据中心时候我们看到一些企业发展,我们到底是要目前在这块板上打一个孔,还是我们要买电钻的问题。从最早经营数据中心时候我们能看到,包括首都在线在1998年,如果没记错,当时盖全北京第一个民用数据中心,其实在2004年我们把这个数据中心卖给北京电信。很简单,我们和我们客户都需要的是数据中心的服务,我们不需要电钻,今天云计算发展过程中,包括邮件系统,我们是要自己建邮件系统还是用邮件,这两个分别很大。我们能看到的我们的客户的很多误解,或者说我们客户不得不做了很多他们不应该做的事情。

举例子现在云计算运营比较大客户类型,视频类和游戏类,我们是互联网类稍微偏多,有基础。我们客户不停说自己要购买这个机器,要装CPU,更盘,电源什么,打标签,做网卡,如果大家自己有这个数据中心托管的这个层面业务,你会看到,你明明是一家做网上教育公司,可以得养,随着业务不断做大,我们见过最大50个IT运维人员,差不多会有几百台,甚至上千台服务器。你要去每年做预算规划买多少网线,多少夹子,多少测网线,测这个标签准备多少备份硬盘,这是我们客户今天干的事情。

在我们经营数据中心的时候,我们和客户出现一业务,那时候没有云计算,客户说什么不搞了,我租你们的,连服务器从头到尾,连维护人员,我如果没记错,最早在银河证券外包首都在线业务,连值班人员,现在首都在线有大概5、6个外包团队是替客户24小时值班,这些是引发我们做云计算的根本出发点,我们希望把这些东西给客户,计算能力,内存交互能力,网络能力。我们客户更应该专注于他们的游戏,他们怎么推广游戏,推广远程教育,推广他们视频,推广迅雷的离线下载,推广离线下载帐号,这些是客户主业务。我们最早做云计算的动因和出发点,从解决客户他们把客户不应该做的这些IT业务要让他简单地以外包的低廉成本形式呈现。

我们客户在更上一层层面上,我们也提供了类似于不但你的服务器部署,连应用环境能够提供标准,我们在云平台部署好。这件事在实践过程中经历很多波折。

我们客户主要针对于用户的接口,管理接口,广告接口这部分是我们客户负责的。我们云计算大体从IAAS和PAAS层提供服务,向所有给客户的客户提供这种SAAS客户提供服务。我们来简单看一下,我通过这种方法能给客户带来什么改变?因为这个案例是非常明显的一个案例,我们和这个客户从更早时间开始合作,2009年我们和这个客户由于主机托管业务产生很大纠纷,这个客户是游戏客户,这件纠纷触发我们对云计算选择方向问题。在这个客户的一个游戏叫南帝北丐上线后,他们非常快速度形成业务扩展,他们租用服务器方式,客户以一年到两年期按与付费给我们租赁,我们一次性服务器到位。客户原计划是说这个游戏差不多每星期增加一组服务器,差不多8台服务器,由于游戏火爆,差不多每天增加服务器,刚开始的时候。我已经预见,我从09年到现在遇到两款游戏是这样的。我问主管不能预估这个游戏上线之后量,他说能预估那个基本肯定买彩票,我买彩票肯定能中,看到我们游戏行业竞争力。

迅速提升要求我们迅速提升服务器,当时服务器提供商空运不小心弄成路运,这个游戏没记错,一个月增加100、200服务器,运行10个月之后,这是页面游戏,开始每个服务器客户减少,我们看到这个客户空出来将近40台服务器,这时候商量,咱把服务器电,我能不能不交,我说得从机房搬出去,搬出去有一半服务器钱没付,这时候闲置40台服务器,不得不交给我机架费用,交每台服务器租用费用,客户不满意,我没有办法。合同这么签的。

所以在我们设计云计算平台时候,我们一再提我们有没有能力替这种客户服务,还是我们没有能力提供服务。我们能不能改变种服务现状。事实上当我们选择这个云平台时候,第一个对云平台性能要求,要满足高性能服务计算能力,这种端由,所有游戏客户是非常大的考验,后面有测试数据大家可以看。由此我们上云平台之后,仍然是这个客户他后期又上了一个游戏,我们来看这两件事对比。后期这款游戏初期规划90台服务器,我们从中关村买回来,自己配,基本把我们累死了,每隔两天有CPU更换,我们差不多40个运维人员轮班来,最后全部7乘24小时了。我们干过。当时首都在线把IDC卖北京电信,致力于增值服务和提供管理服务部分,我们的所有机房现在全部用运营商的机房,我们在北京有5个机房。以当时机房机柜售价差90台需要80个,每个机柜6千每月。

光机柜和购买服务器一次性成本192万,我们其实这里没算人员,然后当时我们云计算平台已经上线了,我们向客户建议,当时我的销售方法很简单。我到那因为很熟,我说你们买服务器,你们买也是让我买,晚几天买,所有的这些东西因为是一款新游戏,我说别急着,他最怕我一宣传火了。刚开始劝半天,我是拍吧,宣传费用多少?说最高一天600万广告。我说这样行不行,我说给你300万,一人一半。冒风险。这是2010年的事情。90台服务器以当时要的配置,当时是一个4核6G还是8G内存,100G硬盘,我们提供6千一台一年,总共54个。大家看到其实我们当时看的和客户说了这么一件,找我租机柜钱57万,我说减3万,54万给我,我干了,服务器提交了。这是我们当时的非常真实的情景。

其实是一个54万对应的192万的一个事情。即使考虑到折旧也是54万对100万级别的。这类应用级别的云计算,为什么我今天以这个例子开场?其实我们听所有云计算技术的时候,我们都别忘了一个初衷,我们不是高中生,不是为学一个东西,说一会上场考试,谁第一IPAD给你,肯定不这样。我们是为了要拿来做业务,我们是为了能支撑业务赚钱或者说跟人开玩笑,至少不能亏钱,这个例子经典在于如果延伸开来,现在这个客户在我那已经非常大了。由他引来的游戏客户,包括现在我们的很多客户,像完美我们都知道,知道大的游戏厂商现在都在我云平台,这是他们业内沟通,这种传承体现了一种能力,当我有款新游戏时候,现在越大游戏公司越带游戏。当产生新游戏,或者再延伸,当要做新业务时候,云平台提供的是一个崭新的视角,把决策基础,把你的整个的开始的事件这个方法完全改变了,其实为什么?这里还一个数,90台第一个月只付4万5千,如果这是一个完全新游戏,我们等于拿4万5千开始的游戏的测试,这是这件商业风险的评估的风险。评估商业风险或者老板做决策时候是要决策一个,因为有一件事变不了,你说可以8个机柜每个月租可以,如果第一期游戏即使按我们一般客户上两到三组也是20到30台,也是几十万对几万的决策,严重影响决策基础的改变。这是我们的云计算看到的。这为我们很多,目前我们和创新工厂签协议,如果在创新工厂里企业我们希望是不是头半年免费提供多少台机器,方便他们创业时候实验一下,其实所有这些的改变是说,我举最简单例子,如果我有一个小游戏软件,我希望去试一试,而我需要投入这么多硬件和管理,还是简单租用完了,这是我们看到的状况。这是一个根本改变。

像这样运营的云平台应该是什么样的?这是我们从09年之前研发云平台,一步步,中间我们经历很多次的故障和摔过跟头,我们理解云平台,现在看到买几台服务器,装什么东西,就虚拟化,云计算就出来了。云计算要用虚拟化技术,不能说虚拟化是云计算。

我们实践中认为云计算要具备大规模的特征,因为如果没有规模云计算本身后期所对资源的弹性的变化理解就不具备了。可扩展,高弹性,超级稳定的计算服务能力,我们认为云计算应该是一种服务,好像今天我们没有人会轻易买几台柴油发电机在家,我们会用电,装电表用电,白天不用电视关上,停止计费。

我们来看大规模,因为我们的云计算一上来要求能满足游戏客户的需求,所以我这也希望大家有机会来看我们公司销售,有机会真的有这个业务需求可以去和我们销售人员联系,可以去机房看。我们基本选用的都是,我们大概当时提两个通道,一个横向一个纵向,纵向是互联网通道,我们希望要有足够宽通道,横向通道是云平台整个层级的通道,全部的光存储,这个设备在我们机房大概是1200多块硬盘的存储吞吐能力,一会给大家看测试数据。我们所有的设备都选用的目前最顶级的,在我们现在总共有几期平台不太记得,在我们早期选用5680CPU,现在选用2680的CPU,这大规模布局把整个云平台的横向通道和纵向通道能力发挥出来。

这是存储一个细节,所有是2.5寸高速硬盘,所有大规模的存储主要是为我们客户提供非常高地我们叫存储虚拟化IO能力,我们大概做基础平台时候专注于三方面,计算能力虚拟化大家都有很多次,我们主要专注于网络虚拟化和存储虚拟化两部分。

可扩展大家看一下,因为我们的构架一直是以核心交换,这是一个思科的,目前也是云计算最顶级交换机。所有的我们目前的云计算的能力是一框框刀片横向扩展的。尊出也是一个整机柜,我们存储目前用日立银行级的VSP最顶级存储,也是我做这家公司之前,正好做过日立代理,我卖银行存储从来没出过事,我们选择最重要一点就是从来要让它足够稳定。所以可扩展。

高弹性,我们现在平台日常储备都是千台以上扩展能力,为啥储藏这么大?因为我们以数据中心1998年有数据中心,数据量大,我们一直以数据中心的客户业务为中心,我们弹性真挺大。我刚才说可能这里有人知道,我们一家,应该全中国做页游最大的客户现在在我们那。我上星期看他开开关关机器,因为很多游戏,这个关那个开,开开关关游戏大概一星期里这边有这么70、80台关了,那边有50、60台开了。如果没有足够弹性能力没法满足客户需求。

这是另外客户,一直以来我们向他推荐云计算,挺大店商,3月1日搞店庆,这个点专门做化妆品的,化妆品打折,原先在我们那差不多400、500兆流量,当天申请2G带宽,跑满了,到晚上我们发现流量突然掉下来,报警打电话问说物理服务器瘫痪,我不记得多少台,大概30台物理服务器瘫痪。我们主动上去说我们可以拿云主机尽快帮助恢复,当天晚上没记错是到第二天,实在是解决不了这个问题。因为如果我没记错,当时两会开着,两会期间机房不能进新服务器,可以搬出,不能搬进。到第二天客户同意我们提供30台,我们用大概6小时时间按照他们要求部署30台服务器,服务器恢复了。3月8号店庆结束了,我不知道是老板还是技术总监,不信任云计算,接着用物理机,关了。

但是这个过程我觉得非常经典,就是我们想要的,我想开打开,我想停的时候应该能停下来。但我今天买服务器,保证3月1号买8号停了,退多少钱肯定不行。卖二手可以,我们卖二手感觉我们用一年服务器卖二手只剩35%,基本用一年再卖,人家说当时2万买,都买原装,我们拆了把CPU卖了,原装内存卖,这个壳子不值钱,最多8千,这还面子。这是个问题。

其实我奇怪,卖这么贵,我直观感受,现在除了汽车,第二个是服务器,这贬值太快,3年剩1千块了。我们服务器,因为我们也打交道,我们给自己定义是刚开始3年,后来说2年半服务器开始逃,你们服务器多给点,内存多,内存单独卖钱。这种是我们要的,我们想开始就开始,想停就停。

游戏目前用说,说加就加说减就减,这个是最近发生的案例。我不知道有没有人玩游戏,不得不举一些游戏案例,确实是我们大客户群,确实他们故事真多。韩国十年前一个游戏RO,这个游戏十年进中国运营不成功,十年之后韩国公司有人真把这个拿出来,中国公司真敢接,他们老板说接的原因很简单,好像太便宜了,拿回来玩去。玩完这游戏说,你肯定把自己玩死了,他们是春节之后上线的,同样这是我说的两个游戏,原来说一星期增加一组游戏,现在一天增加一组,那人飞快从春节到3月份飞快上来。有一星期每天加服务器,如果是物理服务器还好,我们每天开。这才几月份,现在才5月份,如果没记错两星期之前开始下降了,这个游戏。我特奇怪,我专门找人问了,说好多对RO印象深刻,不知道为什么在中国运营不好,这个游戏出来,好多玩家玩,但必定是10年前游戏,怎么可能和现在3D动画比,大家飞快玩得觉得没意思,人数飞快涨起来,飞快下去。

这个客户还是赚钱,起来我提供云主机,下去时候退掉了。这是非常经典案例。我不太希望大家做这种短线业务,我只是让大家感受到底云计算应该带给我们什么。

刚才讲了封网,稳定这部分我们主体稳定这部分的动作是我们有专有心跳网络,我们现在做有点奢侈,我们是4台机器有一台,我们每一个集群,所有漂移会这台备机,我们一框刀片16片,用惠普和戴尔的,我们在里面分,所有来看的人说奢侈。其实刚开始为了给客户建立稳定环境,因为刚上时候确实折腾几下,当时做16台机,16个刀片一个机群,16个里一台备机,那台出差错又一台出差错,搞死了。所以后来放很多。

如果牵扯到运营部分,其实现在我们看到越来越多传统企业开始进入互联网,我看到的包括用友这类往往说,再有5年谁拿光盘卖软件谁等死。现在我知道的当然也在我们平台上,我知道用友一些企业软件,我直接提供服务,其实这个改变非常大,我今天说没有一个公司内部管理软件,我们想买,您来拿PPT讲,我直接开一个马上能用,我一小时4小时之内开出来可以用,用多长时间您来决定买不买,这个不一样。

我们在本地传输这个部分也做了很多备份,都是为了保证整个云平台,云平台还一个致命的这里都没讲,举最简单例子,把邮件系统放上,如果网络出口堵了,不管什么技术,有100台备机没用,因为出不去。这个在我们这么多年运营经验里至少碰到1、2回,比如骨干网光纤断了了,上个月的断了,所有往那个方向去的都堵。包括我们现在上海和广州建立云平台,用直联光纤打通,是保障云平台超稳定概念。

这是我们的一些认证。

我简单过一下,从产品层面上简单过一下,我们大体上6类产品,因为2009年一上来云平台,我放在你存储里,虽然我解释全加密的,人家拿下来硬盘读不出来,没用,客户说你安全吗?安全我听邮件系统说了,你用这个随机令牌,我们了解的一分钟重算一次密码,这个密码拿世界顶级机器破解要72小时,所以这个动态令牌密码被破解可能性确实很小。在我们特别高级别客户里需要锁定客户,直接云平台提供动态密码,租一个令牌,客户问租一个,用的时候租,一天一块钱就可以有动态令牌。部署这套令牌,所有东西一年几十万。我们全部给客户弄好了。可以租可以不租,今天客户不租了,现在今天技术大家越来越了解了,底层安全怎么实现,怎么做隔离的。安全另外部分是我们对所有的客户需要提供监控部分都可以提供监控,而且在我7乘24小时提供声光报警,对所有大客户这个免费。这是为什么我所我们店商客户晚上流量,我们看着刷比那个股市下跌得快,我们技术人员说啥,他们担心客户把我们网络跑爬下了,他们担心我们网络出了问题,一打电话说是他们机器出了问题,说我心放下,当然我觉得从各自职责来讲这么想没什么错误。

云主机产品只突出一个字性能强,我们说快,快的话当然这是虚拟化我们提供几种解决方案,如果用Windows我们强烈建议用HAP-V的,如果用Linux是更好选择,更稳定一些。

我简单看一下,我刚才讲到我们全部现在采用E5280,因为租用一台云主机,在我这开测试马上看到CPU,选择的原因很简单,让客户极大的体验到性能,这个如果没记错,这是我们租用客户一台机器指数,这是我们机器指数,这两台机器一个2.4G,一个2.8G,因为后面有一个简单的性能测试,这是我们自己的服务器。我们在云平台上还给开元系统做点贡献,给他们提供几百兆带宽来提供LINX的服务,我们公司有几个人,他们建设乐观整个LINX镜像,在我们机房LINX升级本地网络非常快。

我们看存储测试,存储构架讲了,全光存储,我们32个8G通道提供系统存储的IO能力,我来简单介绍一下,因为我确实遇到我们客户有一些人说,我的物理机跑到80%CPU,在你云平台不一样。我们研发人员说保证没问题,我们看到确实是大部分客户原因是CPU高是由于磁盘IO非常高,整个用单机系统提供不了磁盘IO,把CPU拉高了。为什么磁盘IO拉高?这个例子特别简单,磁盘IO像吊车,得到一般块块调,我们是存储虚拟化部分做了一个整合,这部分不光是日立本身的技术,我们底层用日立技术,在15K硬盘和SSD分层,就能看到,如果在我们云主机拷贝文件,多拷贝速度变成瞬间,因为最后提升到内存里。我们有相对于每一个集群提供一个2T级别内存的缓存,这种内存严格保证了不掉链,大幅度提升每一个客户磁盘IO能力,我们大部分客户一上到云平台CPU马上是,最多我见多百分之十多,肯定20%以内。我们欢迎大家测试。我们测试免费。

一般我们讲的时候是连到网上给大家做实际案例,这个懂技术的人知道,这是模拟数据库4K的,百分百写的,顺序30%随机70%,我们拿市面机器简单对比,这是市面有明机器,提供921个IO,平均大家能看到平均每秒,由于4K,只有3.6兆,IO已经到922毫,都是拉高CPU的原因。

我们向客户合同承诺提供3500IO,这个测试里我们没做任何保留,大家有机会登陆我们域名上面有测试,打电话可以测试。这个测试大家可以自己跑。我们能提供5万2千IO,我们最高19万IO出来。平均每秒205兆。响应时间77毫秒,这是降低应用占用CPU的有效手段。

其实我在实际案例中看到我们一些客户最爽的备份爽,700到800兆,这个速度对于备份是非常爽心悦目的,后来有的客户说数据多得一晚上备不完,我们客户经常是发现确实现金压力比较大,一台机器高饱了还得用,真有技术人员说,每次那台机器重起,千万要起来,因为没备份完,说这机器起不来瞎了,我相信做过运维的人都有过这个感觉。

这是云计算带来的,包括我们在云计算前我们提供这些东西很困难,因为要占用很多物理机器。

后面讲云备份是基本的,我们现用国外流行备份方法,就跟一个网盘一样,从数据库到等级级别备份软件缺点复杂,我们给中粮集团做过,说这个太不好用,我们技术人员过去设全自动的,自动备份和恢复变成全自动,客户觉得好用。

云邮件,刚才看到前面我们友商介绍,我们云邮件简单,云主机装微软的,刚才介绍功能差不多都有,但是缺点是微软的比较贵。办公IPAD深用Windows7,这些是基于我们平台,在我们技术软件和发展范围内做出来的一些典型的SAAS应用,用户很少,但是其实我们也向大家证实这些应用很轻易做出来。

这是我们自己服务平台,这是完全脱离了RGP的,我们可以一个帐号多子帐号,看到不同公司同部门不同核算,假如前端机被人黑,我发生过,不小心点禁用网卡进不去了,告诉用完成桌面,如果是物理服务器,我刚才说的状况出现非常难受,或者除非连多网卡。

案例简单介绍一下,一个是客户搬迁的,这是原来客户在机房里,看那些线,100多台服务器,从规划到搬迁25天,35个人搬60多公里,从昌平到机房,这国内很大运营网站,每个网站发展都是说节约成本,降低成本,一旦业务起来保证客户感受,这个搬迁避免不了。我们算了包括租用费用120多万。作为客户新增业务改云主机,100台云主机搬迁带来成本节约,只需要花60万,100台全部一个机房向另外一个机房传输,根本感受不到搬迁过程。

这是国内比较著名空调企业,他们的问题是在于他们办公OA在他们办公室,一个专业的空调厂商负责雇OA办公人员,只能接触这点技术,人员换的非常快,后来OA服务器怎么配置没有人清楚。但是机器已经老旧到再不换要出问题了,我们当时的做法是我们不清楚怎么办,我们在他办公室和我们机房网络搭建虚拟网络,物理机向云主机转换,直接转换云平台机器,双线并行,跑得稳定之后再考虑换物理服务器,各个分公司也都通过专线直接访问到机房,这是把原来一个比较棘手的问题用云平台解决了。包括备份系统,他们现在直接用我们的系统,这样所有的东西,到现在那几个服务器都是黑箱子,到底里面多少配置,哪些看懂看不懂。

这个不讲,这是非常有名的网站,我们客户其实是我们云平台发展的动力,因为我们做完云平台,客户拿这个云平台加物理机,做了非常有趣的负载均衡,是用的LINX的负载均衡技术,以前做双机花很多钱,他们花很少成本做高可用的,负载机群是物理机和云主机混搭,这台大服务器是一个主力的数据库服务器,用多少台云主机满足读网站,这是非常有意思的案例,我们以前举办自己客户会请这个客户上来介绍怎么用云平台加物理机完成高可用的。

我们看到很多企业被逼着走到云平台,这个服务器到期换要几百万,老板一批钱头大,变成云平台。另外一种这个服务器里很多东西,技术人员走了,搞不清楚怎么办?服务器老旧了,再不换瘫了。所有这些东西,但是其实很高兴是说近一年来,我们很多客户主动规划他们业务,要用云平台,这是非常可关现象。

今天就这些内容。所有内容是我们在学习技术时候,不是为了考试。我们拿技术能不能做点业务,做点业务能不能赚钱,让我们生活更好。其实对于我们来讲一样,在我们传统托管业务里,我们云主机这些,传统的机架服务器和电力成本越来越高,带来很多成本压力,这是我们做云平台初衷。谢谢大家。 

(责任编辑:com198 )
分享到: 0

展会早知道

输入电子邮箱,了解最新展会动态:

CIO-CRM-ERP-IM-IPV6-IP电话-IP语音-OA-UC-VPN-安全-测试-存储-电源-多媒体通信-服务器-呼叫中心-交换机-联络中心-路由器-企业通信-企业网-企业信息化-企业业务-企业应用软件-渠道商-融合通信-视频会议-视频监控-数据通信-数据中心-统一通信-网真-协作--虚拟化-移动办公-应用交付-远真-运营商-运营商政企/集客业务-增值业务-智真-IAAS-PAAS-OA-ERP-容灾备份-Virtualization-虚拟化-大数据-公有云-混合云-云安全-云平台-云应用-绿色IT-运营商政企/集客业务-物联网-移动互联网