܄

2015年中国公有云服务发展报告(服务运营篇)

【数据猿导读】 对于服务提供商来说,网络不可达的现象是不可感知的;对于用户来说,网络不可达的现象是可以感知的。因此,用户和服务提供商之间的理解和感知是不一致的

2015年中国公有云服务发展报告(服务运营篇)

金山云

金山云在国内有华东和华北两个大的区域(Region)。华北主要是北京、河北、天津;华东在上海、浙江。国外有美国(北美)和香港(东南亚)两个区域,未来会有扩张的考虑。数据中心都是远程管理的,并不是每个数据中心都需要现场部署运维人员。系统层面的扩容通过软件实现,硬件层面的扩容需要外包人员进场。

金山云认为国内公司和国外公司对于服务等级协议(SLA)的定义是一致的,但是对待 SLA 的态度是不同的。此外,用户和服务提供商对于 SLA 的理解也是不同的。用户往往从自身的角度去看待 SLA。譬如说,对于服务提供商来说,网络不可达的现象是不可感知的;对于用户来说,网络不可达的现象是可以感知的。因此,用户和服务提供商之间的理解和感知是不一致的。金山云承认这种认知差异是客观存在的,云服务提供商应该设法获得客户端的真实认知。

在过去几年中,金山云处理了各种各样的突发事件,包括人为事故和不可抗力。供电失效导致机房不可用,光纤挖断导致网络不可用,都遇到过。金山云认为任何可能发生的事情一定会发生,绝对不能有任何侥幸心理。至于什么时候发生只是时间问题和概率问题。而是在方案论证时不能放过任何可能发生的事情,所有可以预知的问题都要有应急预案。譬如 AZ 对称设计,要理解为什么一个 AZ 要跨数据中心部署。在不可抗力的处理上,取决于人力的实力、技术的实力、公司的实力。譬如天津港发生爆炸的时候,某大型互联网服务提供商的天津机房全部出现了问题。云计算在这个层面上,真的特别需要资源。小型服务提供商基本上没有资源去应对这个事情,他们可能就是在赌一个小概率事件。金山云已经做到了对任何突发事件都有应急预案。

安全是云计算服务的重中之重。AWS 最近发布的产品,都和安全性有关。来自内网和外网的攻击行为,譬如端口扫描,金山云每天都遇到。对付外部攻击没有什么好的办法,基本上就是流量分析,把攻击流量引导到黑洞。核心问题在于流量识别的效率,流量黑洞的容量,需要从资源不断投入和技术不断迭代两个方面来解决。用户关心的是多长时间自己的业务能够恢复,厂商关心的是怎样处理才不对其他用户造成影响。除了网络攻击行为,还有一些人为的、机制的、管理的漏洞会导致安全盲点,有一些意识不到的没看见的问题。在安全问题上,厂商需要尊重客户隐私。云计算服务提供商往往会把自己当上帝,忽视用户的自主意志。所有的技术都是为了解决业务场景而产生的。金山云倾向于用技术来解决业务场景,但是不建议用技术来替代客户做决定。

如果客户需要使用金山云的服务,金山云的商务团队和技术支持团队会同时和客户沟通,了解客户需求及其需求和金山云产品的匹配程度。金山云的业务增长速度很快。云存储领域,用了两年时间接近200 PB,规模和增速都是全国第一。云主机领域,吃下了游戏行业的大部分客户。今年新推出的手机游戏,大部分运行在金山云上。2015年金山云在海南开了一次游戏生态大会,到场的有400家游戏厂商。金山云目前的服务器总量还没有超过10万台。金山云也不认为现在有任何一家国内公有云服务提供商能够达到这个规模。依照目前的增长速度和市场需求进行估算,金山云可能在两、三年内达到这个规模。

金山云的计费模式是按天结算。金山云认为计费模式不是一项核心能力,修改计费模式是一件很简单的事情。未来市场竞争极其激烈的时候,金山云可能会修改这个计费模式。金山云有自己的 IPv4 储备,具体数量不方便透露,但是能够满足金山云未来几年的增长需要。

谈到国内云计算市场的竞争,朱桦认为关键在如下几点:

资金无论是资源还是技术都不足以成为吸引客户的第一要素,第一要素其实是钱。云服务提供商给客户提供的是一种租赁服务,其实是一种财务服务。大家对互联网公司的认知就是互联网公司是不挣钱的。假如你用虚拟机,云计算公司不挣钱,那么云计算公司需要不断的投入,累计下来是一个很恐怖的数字。所有不投钱搞公有云的,基本上都是不可靠的。我觉得对中国的云计算,有本质深刻的理解。钱是第一位的。

必须是技术驱动,绝对不能是商务导向和市场导向,必须要在经营上坚定不移的持续投入。做商务和市场推广总是能够吸引很多眼球和机会,但是本质上来说,产品和技术的迭代才是最重要的。战略必须聚焦,如果投入大量的资源在市场和商务拓展,必然要牺牲技术产品迭代的资源。因此,你要看他在技术产品上投入的决心。

规模。云计算说白了是靠规模来驱动整个商业模式的产业。如果没有规模,做到3年或者更长时间还没有达到一定规模,就只能掉队。规模本身也是实力的表现。

人才。需要一个没有权威,不迷信,不自负,不冒进,坚定务实朴素的团队。

金山云只知道要全力以赴去做事情,并不关心其他厂商做什么和怎么做。云计算这个行业,从来都没有说应该怎么做。中国作为世界第一第二大的 IT 产业集群,中国的云计算公司应该有信心超越其他外国公司。中国的市场没有天花板。中国的云计算市场已经衍生出很多和 AWS 不一样的东西。

金山云将 IDC 厂商视为金山云的合作伙伴。现在的客户,越来越倾向于一站式服务。以前创业的时候,需要自己买服务器,自己跟戴尔打交道,自己把服务器拉到机房,自己上架自己管理,需要协调各种单位和人,流程非常复杂,整个行业的门槛比较高。云计算行业出现所带来的契机,就是创新创业更容易了。金山云注入能力和资源,把计算、存储、网络方面的门槛降低下来。未来很有可能是所有的开发工作都跟创业者没关系了。创业者如果要做视频类的 APP,只要用金山云提供的方案就可以了。IDC 和云服务提供商是个共生体。云计算向上延伸能力更强,能够把客户的需求都扛下来。这时云服务提供商就处于产业链的中枢地位,向下驱动对 IDC 的需求。目前云计算这个行业还不够成熟,才会出现 IDC 和云服务提供商之间的矛盾。再过几年,可能就没有这个矛盾了。

金山云没有过多地考虑过 OpenStack 和 OpenStack 生态圈这个事情。金山云采用 OpenStack,主要是因为团队在起步阶段使用了 OpenStack。开始的时候,金山云迎合上游或者意见领袖提出的观点和路线图。慢慢地做下来,金山云发现开源意见领袖的架构和规划其实无法和金山云的一线需求相比较。这个时候,金山云和开源意见领袖之间就出现了分歧。金山云是一个具备超强研发能力的团队,对自己的技术实力有信心。因此,金山云的观点是金山云要自己决定研发方向,不冒进,不轻信。金山云关注社区的变化,同时保留自己的看法。目前 OpenStack 在金山云里仅仅是一个管理工具,并不是金山云的核心。金山云认为核心能力上的进步才是硬进步。公关宣传出来的进步不是真正的进步。如果说 OpenStack 代表云计算的话,这完全是偷换概念。金山云是真正把云计算当作事业来做的,切身经历了中国云计算领域的迭代。OpenStack 的目的并没有那么纯粹,只是把目前的很多概念装进去。金山云内部的 OpenStack 版本,在功能和性能上都远超社区版本。金山云对开源的态度是开放的,也热心地希望将金山云的能力反馈给社区和其他开发者。但是作为一个小创业公司,金山云还没有能力影响 OpenStack 社区。等到金山云的能力强大了,金山云还是希望回馈社区的。

中国云计算的格局,2015年在资金、规模、人力上差别已经很明显了。目前整个行业正处在一个转折点上,未来还是取决于产品技术能力的突破上。在这一点上,金山云通过量变已经开始出现质变。纵观整个云计算行业,2016年相对来说应该会更加蓬勃向上。社会对云计算的认识越来越深刻,这个趋势会自然而然地加强。2014年不知道什么是云,没有人用;2015年开始拥抱云,有些人用;2016年云真的来了,越来越多的人用。

金山云的观点是:只要务实,不断加强产品技术能力,任何一个云厂商都有巨大的机会。如果不着力加强产品技术能力,可能就没有机会了。金山云希望有更多靠谱的云厂商出现。这是一个巨大的市场,目前所有的厂商加一起,也只不过占很小的一块。这个行业参与的人越多,在互相竞争中一起往前走,这种状态就越是健康,这个行业就越是会往前走得更快。

美团云

美团云通过位于北京的三个数据中心向客户提供服务,这是因为美团的机房就在北京。机房值守的工作是外包出去的,不需要美团自己的运维人员。对于美团来说,机房内网是互通的。对于用户来说,机房内网是不通的。目前,美团云正在把北京1区和北京2区的用户往北京3区迁移。北京1区和北京2区用的都是第三方机房,服务质量不够好。北京3区是美团和运营商合建的机房,服务质量更好。目前美团正在和运营商合建北京4区。未来美团会在上海开设一个区域,这样华东和华北也都有资源了。美团目前尚不考虑建设独立机房。独立机房如果规模不大的话,得到的网络资源就很有限,抗攻击的能力就不够了。美团给用户使用的是自己的 IPv4 储备,目前投入的是一个 B 段。美团云手头还有几个 B 段,但是尚未投入使用。

在 SLA 方面,美团云认为国内用户对 SLA 的数字并不看重,但对于实际的服务质量要求很高。服务出现故障时,告诉客户 SLA 是几个9,以及现在没有超过 SLA 承诺的范畴,用户是不会接受的。只有用户打算诉诸法律时才会拿 SLA 作为一个赔偿的基准。

对于突发事件(包括不可抗力和人为事故)的处理,美团云有一套应急预案并且定期进行演练。突发事件发生时,美团云会在第一时间通知用户。譬如说某个机房出口交换机宕机了,运维人员会手工地把客户的流量从一个区域切换到另外一个区域。美团云会给大客户提供定制化的咨询,譬如建议大客户不要把服务都放在同一个机房,因为这样比较危险。

美团云的云主机和公网 IP 之间不存在一一对应关系,部分云主机没有公网 IP,所以通过端口扫描得到的云主机数量结果会小一些。这些云主机中90%以上运行 Linux 操作系统,运行 Windows 操作系统的非常少。这是美团云的用户特点决定的。美团云的用户中传统企业不是很多,传统的公司用 Windows 操作系统多一些。美团云的用户大部分是互联网企业,或者是给传统企业提供软件和服务的独立软件提供商。

美团云认为用户忠诚度的问题在国内的公有云服务中普遍存在。在选型的时候,口碑很重要;用户开始使用后,品质就很重要。美团云有一些用户是从某国际知名云计算服务提供商那里迁移过来的。2015年里这家知名的云计算服务提供商出现了几个大的问题,但是都没有被报道出来。这些问题包括整个机房宕机,还有机房发生故障的情况。

OpenStack 为云计算的普及做了很大贡献。从技术上来讲,OpenStack 是一个非常重要的项目。但是把 OpenStack 作为一个产品去提供服务,和市场需求之间有很大差距。把 OpenStack 用在公有云上,需要大量后续的改进和维护工作。OpenStack 就像是乐高模型,你可以用乐高模型快速搭建原型。但是乐高做的房子是不能住的,你还是需要自己搭建一套。

在公有云和私有云之间进行比较,公有云的份额会越来越大,私有云不过是将基础设施迁移到公有云的一个过度阶段。那些认为私有云比公有云更安全的论调,其实是不成立的。举个例子来说,郊区的别墅和市区的小区,哪个更加安全?当然是市区的安保措施比郊区的安保措施更好。最近几年被报道出来的黑客攻击和网站拖库事件,很多发生在私有云上。黑客在公有云上做这些动作,往往是可以被及时发现及时制止的。美团云有自己的流量清洗系统,暴力攻击行为累积到一定的阈值时,美团云会自动地进行流量清洗,用户根本就感知不到。针对账号破解等行为,美团云和做安全的公司合作,一起去进行防范。美团云把安全厂商的产品集成到美团云的产品里面,给用户提供安全的服务。在使用 agent 和不使用 agent 这个问题上,其实没有谁对谁错。暴力攻击行为可以在物理机和防火墙的层面进行检测和拦截的,但是文件级别的替换和渗透还是需要在主机层面去做。这里的关键是要让用户去选择,要告知用户具体的技术实现。如果用户觉得 agent 可信,就选择用;用户觉得 agent 不可信,就选择不用。

在定价策略方面,早期整体云计算行业利润较高,美团云希望做一个低毛利的业务通过规模来盈利,因此将“业界最低”作为定价策略。实际执行下来,美团云发现这个策略并不是一个很好的选择。美团云新的定价策略还没有实施,目前这个定价策略还会维持一段时间。目前国内云计算行业只有降价的没有涨价的,美团云单方面对产品涨价并不现实。目前美团云的规模还比较小,暂时不考虑赢利的问题。未来美团云希望能够通过用户满意度来影响定价策略。

中国的公有云市场的发展速度很快。公有云在中国互联网基础设施中的比例,2015年应该比2014年翻一番。公有云领域的竞争,一半是云计算服务提供商之间的竞争,另一半是所有云计算服务提供商跟传统 IDC 之间的竞争。从2015年的数据来看,云计算的份额增长很快,可能2016年会更快。再往后做下去,会有一些比较大的挑战。现在市场对 IaaS 型产品的接受度已经很高,但是对 PaaS 型产品和 SaaS 型产品的接受度还不高。传统软件 SaaS 化谁来做?这对于中国的云计算公司是个挑战,中国的 Sales Force 还没有出现。

七牛云

七牛做事有一个优先级的考虑,如果这个领域已经有人做了,七牛就将其整合进来不要自己做,杜绝重复制造轮子。CDN 大趋势是已经从资源为中心转为效果为中心,七牛成熟的多 CDN 融合管控方案,精选主流 CDN 厂商优质节点,与七牛自有高质量节点相结合,全面覆盖各地区各运营商网络,真正做到无盲区。

突发事件(包括不可抗力和认为事故)的处理,在运维的层面是一个需要不断完善的过程。七牛侧重于通过历史数据识别出常见故障,争取通过自动化手段发现这些故障,然后自动化触发故障处理预案。这些措施都需要随着时间不断迭代优化。来自外部的攻击行为主要是 CDN 厂商去处理。从 CDN 的角度来看,七牛自建 BGP 网络中间源,消除跨运营商网络回源慢甚至不可达等问题,保护源站带宽不受边缘节点请求波动影响,节省回源成本。

在七牛发展的早期,年增长率曾经达到十倍甚至是百倍,现在年增长率依然保持在五到六倍左右。在七牛所管理的数据当中,冷数据占绝大多数,热数据不到10%。随着云服务商服务年份的增加,热数据的比例会越来越少。从云存储领域的市场影响力来说,七牛认为我们是国内第一。以前大部分云存储的厂商都在学习 AWS,现在国内做云存储的厂商都在学习七牛。在定价策略上,七牛的基本原则是和 AWS 持平。不会刻意把价格压低。

七牛非常关心用户忠诚度的问题。七牛之所以从存储领域切入云计算市场,就是出于用户忠诚度的考虑。从产品属性来讲,存储的用户黏性是很高的,因为他的迁移难度最高,因此用户的稳定性也最高。

盛大云

盛大云设置华东和华北两个节点,是从用户分布出发的。北方是北京,南方是无锡,可以同时服务盛大云内部和外部的用户。盛大云的节点没有阿里云这么多,但是在选址方面有很多严格的考量。中国互联网用户的分布有一个明显的特点,就是集中分布在北京、上海、广州、深圳几个区域。无锡在江苏骨干网上,盛大云在无锡选择了一个 T4 级别的机房,基本上可以覆盖所有南方的用户。在此基础上,以北京的 BGP 线路来覆盖北方的用户。从使用状况来看,这两个节点的用户比例是比较均衡的。2016年可能会增加一些新的节点。盛大云在各个数据中心都有自己的运维人员,7x24小时驻场。我们互联网圈子里有一个玩笑,就是技术再高也经不住挖掘机一铲子。盛大云选择在当地投入自己的团队,就是要大力保障服务的稳定性。

在服务等级方面,盛大云分为两个部分来设置。第一个部分是数据中心,为云计算平台提供服务。这个部分没有设置具体的 SLA,但是可以认为是达到99.99%。这是因为盛大云在数据中心有自己的运维团队,响应速度非常快。第二个部分是云计算平台,为云计算客户提供服务。盛大云有7x24小时值班的客户团队,能够很快地响应来自客户的问题,这个部分的 SLA 是99.9%。有的用户提出了新的需求,或者是发现了软件缺陷。这种情况会有一个流转过程,盛大云会第一时间响应客户,然后转入内部处理流程,最后把处理过程告知给客户。盛大云做了这么长时间的运营,和一些新的云服务提供商相比,在服务方面更深的理解。

对于突发事件(包括不可抗力和人为事故)的处理,盛大云通过异地灾备来对用户数据进行保护。当发生不可抗力事件时,盛大云内部会首先做一个预判,通过公告向用户说明事件状况。如果短时间内问题无法得到解决,盛大云会把线上的资源切到灾备机房,减少对用户业务的影响。盛大云的云主机主目前还做不到跨机房迁移,但是用户可以登录到控制台去申请其他的资源。跨机房迁移的功能在盛大云的研发列表里面。目前没有任何一家云服务提供商能够解决这个问题。这也是为什么盛大云在选址的时候非常看重机房的管理,包括硬件配置、人的因素、供电是否双路、机柜是否双电源、机房隶属于谁、上级单位的性质等等。

目前运行在盛大云上的云主机数量超过一万台,但是尚未达到十万台,使用运营商提供的 IP 地址。其中,95%以上的云主机是带公网 IP 的,不带公网 IP 的云主机数量极少。运行 Windows 操作系统的云主机占60%,运行 Linux 操作系统的云主机占40%。盛大云在国内云计算市场起步比较早,早期的用户使用 Windows 操作系统更多一些。操作系统比例也是用户自由选择的结果,体现了用户的性质。盛大云的用户,大都喜欢易用性比较好的 Windows 操作系统。盛大云只想低调务实地在云计算领域做事,不太关心在市场份额的问题。盛大云的用户中,有40%到50%都是在2012年以前注册的,这说明盛大云的用户忠诚度非常高。这些用户一直在持续使用,持续付费。从2015年下半年开始,陆续有一些用户从其他友商那里转过来,这是盛大云不断提高用户体验的结果。

盛大云也提供基于 OpenStack 的私有云解决方案。一开始的时候,OpenStack 想要进入公有云市场,希望打破 AWS 的封闭式的公有云格局。盛大云在实际运营过程中发现,客户对于使用 OpenStack 来构建公有云还是处于观望状态,导致 OpenStack 在公有云领域的成就并不大。OpenStack 要打入云公有云,还是需要一点时间。它对公有云的冲击,现在和未来都不会很大。但是 OpenStack 在私有云市场的接受程度还是比较高的,必然会在私有领域占据一席之地。

腾讯云

腾讯云从北京、上海、广州、香港、多伦多提供服务。腾讯云的选址决策是基于 QQ 和微信产品的热力图做出的。哪里人多,腾讯云就选址在哪里。中国的经济版图,基本上就是华南、华中、华北,集中了中国的人才和财力。选址香港是因为腾讯总部在深圳,选址北美是因为腾讯当时使用过 AWS 等相关服务,多伦多这个点是和 SoftLayer 合作的,北美的网络连通性比较简单,具体的地理位置不是很重要。2016年腾讯云将东南亚数据中心提上日程。腾讯云在各个数据中心都有经理,有一个本地化的团队进行运维。

不同地理位置之间的网络是打通的。譬如说一个用户在北京和上海两个区域分别开一台云服务器,这两台云服务器是可以放在在同一个子网里的。有这种需求的用户并不多,通常是超大体量的公司才会有这样的需求。开发这个功能,主要是考虑到容灾和负载分布。譬如说,北方的用户连接到北方的 IDC,用户体验会好一些。

对于突发事件(包括不可抗力和人为事故)的处理,腾讯云有一套应急预案。譬如说天津港爆炸事件,腾讯云启动了应急措施,非常好地保障了服务,完整的服务没有受到任何影响。

如何应对来自内网和外网的攻击行为,譬如端口扫描,腾讯云给用户提供了安全服务,用户可以选择是否开通。如果用户选择开通,腾讯云会在用户的操作系统里面安装 agent。用户可以选择用户信得过的 agent。腾讯云认为需要给公众的客户传播这样的理念:选择大的公司如腾讯云、阿里云、AWS,使用他们提供的 agent 其实是没有风险的。这些东西是放在阳光下的,agent 做了什么事情,都是可以知道的,没有必要太担心。大的厂商,在安全方面都有巨大的投入,用 agent 比不用 agent 要好。

腾讯云的帐号体系是与 QQ 号码绑定的。QQ 号码背后是一整套的账号管理系统,可以是 QQ、可以是邮箱、可以是电话号码。如果用户不打算使用 QQ,简单地把它当作一个邮箱使用也是 OK 的。腾讯云慢慢地也要支持更多的实名认证方式。譬如说 2C 类型的用户,已经可以使用微信支付的方式来购买云主机了。在用户体验这一块,腾讯云是愿意不断优化的。

在公网 IP 方面,腾讯云使用自己的 IPv4 储备。腾讯云也有弹性 IP(Elastic IP,EIP)的功能,用户可以按需使用,不需要的时候就是放掉。腾讯云的公网 IP 是够用的,不会对腾讯云未来的发展造成障碍。

在腾讯云所提供的虚拟机中,Windows 操作系统的比例要远高于15%,但是也没有50%。在腾讯云里还有一部分物理机托管业务,这部分的业务从外界看不出来。在游戏领域,腾讯云是最大的服务提供商。游戏类客户使用 Windows 的比例非常高,因此腾讯云的 Windows 操作系统比例会比阿里云高一些。在 IDC 里面,如果游戏类客户比较多的话,可能会发现 Windows 操作系统占40%到50%。

腾讯云的主要竞争对手更多还是比较传统的 IDC,比如说世纪互联。迁移到腾讯云的客户,很多都是从传统 IDC 迁移过来的。腾讯云的估算是传统 IDC 在数据中心市场的占比还在9成以上。

国内公有云服务的价格是比较低的。如果和 AWS 的价格相比,AWS 的定价比国内要高。两、三年前,国内友商都在通过下调价格来占领市场。但是最近大家有一些默契,认为应该提高产品的能力,提高对用户的价值,不要把价格压下去。企业客户并不是真的非常对价格敏感,而是希望价格合理。腾讯云不希望在某个产品或者功能点上做价格的 PK 去迎合用户,这样的模式很难持续。

在用户忠诚度这个问题上,腾讯云觉得首要在于练好内功,不能要求客户对你忠诚。就像任何人之间的交往,你要给对方带去价值,对方才会给你带来回报。

关于 OpenStack 和 OpenStack 生态圈,腾讯云认为这样一套体系非常完整。腾讯云也在和国内一些 OpenStack 厂商合作推出混合云解决方案。在金融领域,私有云的需求很强烈。用户对资源的要求弹性比较大的,建议优先在公有云上做。如果用户愿意支付相应的成本,则可以在 OpenStack 上实现。OpenStack 和公有云的发展,应该是互相促进的关系。私有的 IDC 必定是单点的,用户需要为所有的资源买单。使用公有云,则只需要为你使用的时段和服务买单。公有云很重要的一点,在于它的网络是否真的四通八达。

UCloud

UCloud 分别从北京、广东、香港和北美四个不同的地理区域提供服务。这个选址决定是因为 UCloud 最初的客户分布,他们的用户基本上都在北京、上海、广深。选择香港和北美,是因为 UCloud 的客户有往香港和北美拓展业务的需求。UCloud 在北京和广东部署了自己的运维人员,但是在香港和北美没有。UCloud 在海外节点的部署和扩容基本上是自动化的,只要厂商把设备运到机房,机房帮我们把设备放上去就 OK 了。

在服务等级协议(SLA)的设计方面,UCloud 分为三个阶段去进行。第一阶段是了解用户需求,也就是他们能够接受什么样的 SLA。根据 UCloud 研发人员从在腾讯和盛大学习到的经验,对用户的需求和期望值有一个初步了解。第二阶段是设计,从理论上计算我们能达到什么水平。第三阶段是改进,从实际运行数据计算、验证、改进。

在突发事件(包括不可抗力和人为事故)的处理方面,有两个问题不是 UCloud 能够控制的。一个是机房问题,一个是全国性网络问题。其他友商遇到过光纤被挖断、电力被雷击的问题。UCloud 的侧重点在于机房掉电之后如何迅速地把用户的业务从一个机房转移到另外一个机房。

应对来自内网和外网的攻击行为,譬如端口扫描,是 UCloud 的优势和特长。在安全方面,UCloud 采取应对措施有三个。第一是区分职责,UCloud 处理网络底层,保障网络的安全可靠,防 DDoS 等等虚拟机以外的攻击行为,用户则负责虚拟机以内的攻击行为。第二是引进第三方安全解决方案。第三是建立内部操作审计系统,进行镜像分析。UCloud 严格限制内部工作人员接触或者读取用户的镜像。对于在用户的虚拟机内部预装 agent 的行为,UCloud 是严格禁止的。虽然这样在管理上非常不方便,但是用户会认为 UCloud 是可信的。在网络隔离方面,UCloud 从2012年开始就给所有用户默认创建一个私有网络,内网不能扫描,但是公网还是能扫描。内部隔离是必然要做的事情。用户还可以通过公网的防火墙来限制访问。

UCloud 通常提前半年对机房资源进行整体准备,根据用户业务需求对资源进行动态扩容,保证25%到30%之间的空闲资源。当空闲资源小于25%时就会对机房进行扩容。每个月都会对下个月的资源需求情况进行预测,制定每周的资源增长计划表。对于大的客户,有客户经理事先沟通,提前了解他们对计算资源的需求情况。通过如上三个措施,确保我们的资源是足够的充分的。

UCloud 没有超售的情况,因为我们的客户和其他客户很不一样。个人客户一般就放一个网站,一个月可能只有一两次百度爬虫的访问。对于这种类型的客户,是有很大超售空间的。但是 UCloud 的客户都是企业客户,他们对 CPU 资源的使用要求是很高的,所以很难去做超售。CPU 和内存是最难复用的。IP 资源是绝对复用不了的。

在公网 IP 方面,UCloud 有两个 B 段的 IPv4 储备,同时也使用运营商提供的公网 IP。此外,UCloud 还在准备自己的 BGP 和 AS 编号。在 UCloud 所提供的云主机中,Linux 操作系统大概占90%左右,Windows 操作系统只有10%左右。UCloud 没有个人客户。就好像一句话这样说:“如果你什么都信仰的话,等于你没有信仰。”服务客户也是如此,如果你谁都想服务好,那只能谁都服务不好。

在虚拟化产品和非虚拟化产品的比例方面,92%到95%是虚拟服务器,5%到8%是物理服务器。使用物理服务器的客户,基本上都是2013年之前的客户,我们也称为有历史包袱的客户。2013年之后的客户,大部分都用云计算了,没有历史包袱。在2013年之前,云计算还没有那么流行,只能用物理机。这些用户的体量可能不大,但是对 UCloud 的战略意义很强,所以要把它们拉进来。UCloud 的目标是先把他们拉进来,等到他们的服务器生命周期到了再逐步转到云上,这就是这些客户的价值。UCloud 云认为0和1之间是有灰度的。UCloud 提供的产品,在帮助客户彻底转换到云计算之前,能够有一个混合的模式来保护客户的投资。这也是一种对客户负责任的态度。

UCloud 的主要竞争对手是阿里云。市场份额则不好确定,因为大部分公司都没有公布业务数据,分母和分子都是未知数。在定价策略上,UCloud 的价格略高于行业平均水平。UCloud 认为企业客户关心稳定性和可靠性,UCloud 要让优质的产品有更好的价格,这样才能够真正解决中国大部分行业要靠低价取胜的思路。这也就是供给侧改革,好的商品是有价值的,好的服务是有价值的。所以 UCloud 的价格虽然会贵一些,但是企业是会接受的。这也就是为什么 UCloud 不做个人客户。这个定价策略和 UCloud 的目标客户群是一致的。UCloud 的客户都是企业级客户。只要你服务好,稳定性好,他是不会因为价格问题离开的。所以 UCloud 的客户流失率非常低,并且越是大客户越是低。

在规模上,UCloud 最大的一个客户拥有的主机数量超过1万台。UCloud 的整体规模大于10万台云主机。运行在 UCloud 上的云主机,大部分都需要公网 IP,除非是数据库等内部业务。但是 UCloud 并没有一个详细的统计数据。从数量来说,因为 UCloud 的中小客户比较多,他们的主机大多数是有公网 IP 的。对于大客户来说,内网 IP 会比外网 IP 多。针对“云主机是一个赔钱的生意,云计算赚钱的业务是存储和网络”这样的观点,UCloud 没有这样分开计算过。

未来 CDN 是一个非常重要的方向。娱乐产业起来了,基于手机的视频点播和直播需求很大。CDN 厂商有明显的优势,譬如网宿。地区性的 IDC 还需要时间来改进和完善他们的全国布点。

OpenStack 最近的发展趋势是非常快的,UCLoud 也在学习和了解 OpenStack。UCloud 和全球第一大 OpenStack 服务提供商 Mirantis 合资在国内成立一个公司,通过这个合资公司去满足客户在私有云方面的要求。目前 OpenStack 已经成为开源社区最有活力、贡献最大的开源项目了。但是 UCloud 没有看到用 OpenStack 做公有云做的好的公司。OpenStack 在私有云领域有相当大的影响力,能够满足相当多用户的需求,但是它做公有云还是有压力的。因此,UCloud 的公有云是自己研发的,私有云则和 Mirantis 联合提供基于 OpenStack 的解决方案,能够满足用户的混合云的需求。

很多人认为云计算就是做 IDC 生意的,UCloud 对此并不赞同。我们认为云计算有五个阶段。第一是替换 IDC 和服务器设备。这个领域大概1100亿到1300亿的年产值,目前云计算所占的比例还非常小,需要把基础的计算、存储、网络做好。第二是在计算、存储、网络的基础上,用户会需要托管服务(Hosted Services)。托管服务的好处是资源利用率更高,这是一种软件服务,不是卖主机。软件服务的利润值更高,黏性更强。第三是 UCloud 在2015年主推的软件市场——U 市场。软件厂商把他们的解决方法放到 UCloud 上来,UCloud 帮助他们推广,形成企业级的软件应用市场(企业级的App Store)。第四是打造服务的应用市场,引进为中小企业和传统企业做服务的公司,譬如运维服务、开发服务、安全服务。很多公司一个月付十到二十块钱,就能够享受这些服务。第五是大数据阶段,UCloud 目前还没有完善的产品模式。

云计算的价值不仅仅是赚钱。云计算的核心价值是“使用比拥有更有价值”。用户不需要拥有计算资源,他只需要简单的使用就好了。这种转变会改变社会的组织运转模式。人们常说,一个组织最大的资产就是人。现在一个公司不再需要招聘运维人才,这些可以通过云计算自动实现。这就像现在的分享经济,由不属于你公司的员工来帮助你。UCloud 的目标就是通过 API 的模式,帮助客户获得他所需要的资源。淘宝非常伟大,可以帮助客户获得他所需要的商品,但是这还不够。UCloud 的目的,是让有一技之长的人能够在 UCloud 的平台上为用户提供服务,发挥自己的价值。

又拍云

又拍云将云计算定义成一个服务,对服务等级协议(SLA)的要求是第一的。SLA 是一个比较重要的指标。跟客户签约的时候,又拍云会把 SLA 放到合同里面。在研发层面,又拍云通过架构优化设计了自我修复的功能。在运维层面,又拍云通过7x24小时的监控,确保出现问题能够及时修复。

众所周知国内网络非常复杂,单纯依靠一个较好的机房或者一个较好的地区去提供服务,不可能达到客户要求。又拍云依靠全局的网络去解决局部性的问题。比如,从南到北,电信和联通之间的长距离传输经常有拥塞,又拍云架构了一个内部网络,不会由于主干网的拥塞而导致网络不可用。公司下了很大的力气来克服国内复杂网络的单点故障问题。又拍云在全国有150多个机房,如果某个机房发生了网络中断,公司可以直接把这些机房从基础设施中移除,流量就不会被导向这些机房。对于用户而言,某个机房的单点失效是不可感知的。

云服务更新迭代的速度非常快。又拍云在发布周期和发布进度两个方面都有严格控制。又拍云有一个专门的房间做发布,叫做发布室。新产品上线时需要进行两次发布,一次是预发布(灰度发布),一次是全局发布。灰度发布是发布到150多个机房中的3个,这时产品和运维人员要集中到发布室,发现问题要及时处理。灰度发布稳定运行24小时之后,再全局发布。又拍云不允许某一个人员单独把某一个功能单独发布到产品平台上。

又拍云有三个比较大的防攻击的机房。在遇到 DDoS 攻击时,公司根据 DDoS 的量级来做不同的处理。又拍云的150个机房都有一定的上行容量,几百个 GB 的流量攻击属于小量级的攻击,基本上不需要理会。遇到大规模攻击时,又拍云会把相应的流量调度到这3个防攻击机房,再把流量分散到其它的机房。在这个方面,公司已积累了一定的算法,筛选攻击来源和攻击对象,在此基础上采取一些更细致的应对措施。同时,又拍云还跟运营商合作,在省级网关那里就把攻击流量给过滤掉,不会下发给又拍云的服务器。

在成长速度方面,又拍云现在全国有150多个机房,4000多台服务器,带宽到了1.5 TB。日均 PV 数量超过500亿,新增存储容量超过5 PB。在又拍云所管理的数据当中,热数据比例在10%以内,90%以上是冷数据,带宽主要服务于10%以下的热数据。

又拍云已经实现了自动化运维,运维体系非常完善,无需在机房部署又拍云的运维人员。服务器厂商出货,配上又拍云的 U 盘发到数据中心。机房人员帮又拍云上架、加电、开机,从 U 盘启动操作系统,启动完成后自动加入又拍云的集成平台。

又拍云坚持自主定价,不会参考其它友商报价。得益于整体规模的扩大,又拍云的优势得以展现,在此前提下,又拍云做过几次幅度很大的调价行为。又拍云的产品定价非常纯粹,基于服务能力和成本,制定一个比较合理的价格。因此,又拍云的调价并不是为了获得竞争优势或者占领市场。

又拍云本身是一家创业型公司,非常注重处于创业期的客户。又拍云是目的培养两三年以后的客户,会对创业型的客户做很大的支持工作。公司把自己和客户绑定在一起,和客户一起发展。

目前,又拍云客户流失率非常低,客户忠诚度非常高。客户把又拍云当成亲密的合作伙伴,又拍云也把客户作为公司的合作伙伴。这跟又拍云的基因有很大的关系。云计算本身就是一种服务,服务质量好,产品够稳定、够好,用户把东西放在这里会非常放心。对于服务型的公司来说,客户的忠诚度体现在你能够给客户做什么东西。

又拍云的目标是打造一个综合的云服务,或者说是一个可编程的 CDN。用户可以在又拍云的 CDN 平台上做开发,不需要单独购买云主机或者是物理机,也不需要区分云主机和云存储。在又拍云这个综合的云服务上,计算可以发生在不同的层面,譬如说计算可以发生在最前端。从大的方向来说,又拍云类似于 AWS 推出的 Lambda 产品,但是要比 Lambda 更贴近用户。

延伸阅读

2015年中国公有云服务发展报告(团队建设篇)

2015年中国公有云服务发展报告(产品研发篇)

2015年中国公有云服务发展报告(用户体验篇)


来源:细说云计算

声明:数据猿尊重媒体行业规范,相关内容都会注明来源与作者;转载我们原创内容时,也请务必注明“来源:数据猿”与作者名称,否则将会受到数据猿追责。

刷新相关文章

UCloud创始人季昕华:公有云窗口关闭,盈利重点在大数据和AI
UCloud创始人季昕华:公有云窗口关闭,盈利重点在大数据和AI
《2017中国智慧物流大数据发展报告》完整版发布
《2017中国智慧物流大数据发展报告》完整版发布
饮料行业发展报告:可口可乐追加对越南投资
饮料行业发展报告:可口可乐追加对越南投资

我要评论

精品栏目

[2016/10/10]

大数据24小时

More>

[2016/09/26-7]

大数据周周看

More>

[2016/09/01-30]

大数据投融资

More>

[2016/11/28-2]

大咖周语录

More>

[2016/11/29-6]

大数据周聘汇

More>

[2016/12/06-13]

每周一本书

More>

返回顶部