X

阿里云:跌宕的十年,飞天的时代

如果从2008年阿里巴巴决定在国内做云计算算起,云计算在国内已经走过了10年的发展路程。本次我们以阿里云为例,回顾10年时间阿里云如何以自主研发成就比肩国际AWS和微软Azure的“3A云”?

如果说从2008年9月,阿里巴巴在国内最早确定“云计算”和“数据”战略,决定自主研发大规模分布式计算操作系统“飞天”——阿里云的核心操作系统算起,云计算在国内已经走过了10年的发展路程。

在国内10年云计算的发展过程中,有盛大云、世纪互联等开拓“先烈”,也有IBM、Oracle在国内拓展折戟,当然也有AWS和微软Azure等艰难入华的云计算企业。

这其中阿里云是个值得关注的特例,阿里云2018财年收入达到133.9亿元,从营收排名看达到全球IaaS服务提供商第三名。国内云计算跑出来的企业,为何不是IDC或者是IT企业,而是做电商的阿里巴巴?本文试着梳理阿里云的发展历史,作为云计算10周年的回顾和总结。

Gartner:阿里云以3.7%的份额位列全球

  • 飞天艰难起步

2009年春节后,一群年轻人在北京上地汇众大厦一间快要废弃的办公室里,写下了阿里云计算操作系统“飞天”的第一行代码。2018年7月阿里云CEO胡晓明(花名孙权)动情得回忆到那一刻说道:“2009年1月,马云与阿里云飞天研发团队合影,匆匆一过快10年。这是一群用技术改变世界的梦想家!”

飞天系统是阿里云核心的IaaS产品,是阿里云团队从零研发的自主国产云计算系统。阿里为什么要做云计算?在2012年深圳IT峰会上那场广为流传的辩论可以得到答案:当时李彦宏说云计算是新瓶装旧酒,没有新意;马化腾说云计算要在阿凡达时代才能实现,只有马云说阿里不做云计算可能会死。

今天我们会称赞马云决定做云计算的前瞻,然而逼迫阿里做云计算其实另有原因。由于阿里云和亚马逊同属电商企业,电商业务天然面临发展快,并发量大的业务数据处理难题。

时任阿里首席架构师的王坚曾告诉马云“未来快速增长的业,会导致IT基础设施成本拖垮阿里”。这也是为何超级电商亚马逊、阿里巴巴、京东等企业都做云计算的根本原因。

不过当时就下决心做云计算还是一件十分不容易的事情。原阿里云创始员工、默安科技创始人/CEO聂万泉告诉亿欧:“早期的阿里云属于摸着石头过河,云计算是什么没人讲得清楚。从虚拟化主机到飞天大数据操作系统,最终发展到今天真正的云计算,认知层面的经验是最宝贵的。公司层面也经历从技术驱动到技术市场双驱动模式,换过两任CEO,都是踩过的坑。”

最早马云决定让阿里金融以捆绑创业的方式成为阿里云的第一个客户,帮助阿里云试错与成长。2010年4月阿里金融的“牧羊犬”产品在飞天系统上线,那时候阿里云经常出现不稳定以及数据出错等情况,十分影响阿里金融业务的开展。

无法忍受的胡晓明,有一次在跟马云在西湖散步时直接说“马总,您能不能放我一马?”马云当时的回答很确切:“不可以,阿里云是未来。”

没有马云的强力支持,没有王坚团队的锲而不舍,也就不会有后来阿里云被称为3A的故事。在早期跌跌撞撞两年时间,阿里云初步完成了产品打造。

据说这期间阿里云的产品曾经推倒两次。直到2011年阿里云推出了云服务器,TeamCloa和筑云成为第一批上云的企业,“试飞员”是阿里内部对这批用户的称谓。

尽管阿里云早期的创业历程十分曲折,但是云盾(阿里云安全产品)居然是和飞天一同启动的项目。在2009年初聂万泉还在B2B负责中国站的安全,王坚博士深知安全对于云计算的重要性,把当时包括聂万泉等阿里集团最好的安全人员调入了研发院,这是非常高瞻远瞩的安排。

不过当时阿里内部对王坚的评价比较负面,也很少有人理解王坚的决定。YunOS的失败以及阿里云还没有起色,让很多人称呼王坚是骗子,叫马云不要听他的。

“董事会除了马云也没有人支持阿里云,而且昨天一起开会的总监很可能第二天就不见了。”聂万泉形容那段创业经历就像“血战钢锯岭”,不断有人从身边离开。但是马云选择坚定的支持阿里云创业,在那一年的年会上,王坚泣不成声地演讲定格为国内云计算开拓者的悲情。

2012年的飞天奖颁给了阿里云事业部,颁奖词是“坚持就是伟大”。今天看来这句话无疑是最强的真理,相反例子是盛大云2年没有盈利便被陈天桥放弃,阿里云是坚持才成就的今天地位。

  • 步入发展快车道

2013年是云计算的一个转折点,这一年可以说云计算热潮刚刚兴起。UCloud和七牛云等第三方云计算企业都是在这一年成立,腾讯开放平台也是这一年对生态企业开放,另一方面AWS高调入华掀起了云计算关注热潮。

从阿里云看这一年也是至关重要。先是2013年月1月份,阿里云和万网联姻。阿里云与万网合并为新的阿里云公司,万网能帮助企业备案让阿里云后续免去了很多麻烦。

然后是6月阿里云获得跨地区IDC牌照。那年阿里云发布了飞天5K集群,这是当时世界上第一家对外提供5K云计算服务能力的公司。外界慢慢对阿里云有一些认可,阿里云慢慢的获得了外界的一些支持和谅解。

更重要的一件事是原阿里金融负责人胡晓明接替了王坚,成为阿里云的CEO。王坚本身对技术有足够的远见,适合阿里云的起步。胡晓明更善于管理,守业无疑胡晓明更适合。

那时阿里云能够提供稳定服务的证明,是12年的双11,阿里云跌跌撞撞地扛住了百万次的高并发;到13年双11,350亿的成交数字,80%的交易都是通过云端搭建的“聚石塔”完成。

不过如果选一个阿里云发展过程中会被IT历史记住的时刻,应该是2013年5月17日,阿里集团最后一台IBM小型机在支付宝下线。从2008年阿里提出去IOE口号后历史5年,阿里内部完全不再使用IBM的小型机、Oracle数据库、EMC存储设备。

建立先发优势的阿里云,在2014年开始了第一次降价,云计算行业竞争开始激烈起来。直到今天阿里云仍旧维持定期降价风格,阿里云的先发优势与资源优势开始体现出来。位于北京的一家云计算企业回忆当年阿里云降价:“第一次降价是有些惊讶,但是一年降6次价就完全措手不及了。”

2015年,12306部署在飞天上,春运高峰分流了75%的流量。彼时阿里云已经建立起行业领先地位,ZStack创始人张鑫记得当时回国与阿里云的人交流,阿里云问的一个问题已经是规模化的问题:“如果物理机足够多,比如并发创建10万台虚拟机,IP算法如何不冲突?”张鑫介绍ZStack将IP分段,设置随机起跑点就可以极大减小相撞几率。

这一年阿里云在行业内首次发起了《数据保护倡议》,承诺不碰用户数据。接下来的2016年1月,阿里云发布一站式大数据平台“数加”,同时2016年8月阿里云更换了全新的LOGO,并发布人工智能ET,正式进军AI产业。

如今阿里云的“ET大脑”已经在多个行业落地。目前ET大脑包含ET环境大脑、ET农业大脑、ET工业大脑、ET城市大脑、ET医疗大脑。当下发展较顺利的是工业和城市大脑,更多产业落地还需时日。

  • 为何成就的是阿里云?

根据最新财报,2019财年第一季度财报来自云计算业务的营收为人民币46.98亿元(约合7.10亿美元),同比增长93%。虽然增速过跌破百位,但是阿里云依旧维持了高速增长。

阿里云能够成功,应该将主要原因归为以下几点:

第一、研发自主的飞天系统

实时上在2010年OpenStack发布之前,也有Eucalyptus等开源云平台。但是阿里云决定从零开始搭建自主的飞天系统。这确保了云的整体架构是有机统一的,能够随时随地的无间断升级,并在全球范围内水平扩展。“如果不是自主研发,我们根本无法应对‘双11’32.5万笔/秒的交易创建峰值。”阿里云技术研发负责人蒋江伟这样说道。

《超越Hadoop》一书中也提到:阿里云战略上最与众不同之处,就是坚持追求拥有自己的具有竞争力的核心技术。

而且,经过三年艰难地技术攻关,数次推倒重来,终于跨过了这个技术门槛,依靠自己的技术力量实现了飞天(Apsara)这个非常扎实的通用大规模分布式计算系统,它除了MapReduce之外,还支持最广泛的各种编程模型。

第二、收购万网,获得数十万中小企业用户

万网虽然在2009年被阿里5.4亿人民币收购时,是阿里系当时最大的投资。其实这笔投资是曾任阿里B2B CEO卫哲促成投资的,当时收购的目的是让阿里巴巴在中小企业电子商务链条上延伸。不过阴差阳错,万网在电商领域并没有怎么帮助阿里云,却为阿里云的冷启动立下汗马功劳。

一位早年曾在阿里云就职的人告诉亿欧,当时阿里云把万网上的用户都转到了阿里云上,直接拿下20万左右的企业用户。阿里云也支撑住了这些客户的运行,然后逐渐从互联网客户拓展到更多的传统企业中去。而如果当年阿里云一家家得拓展用户,其艰难可想而知,可能阿里云的发展就不是今天的局面。

第三、去IOE战略,催热国产公有云服务

2013年的棱镜门事件,对国家信息安全无疑敲响了警钟。马云此前提出了去IOE计划,无疑迎合了国家安全这一主题。有观点认为,当年阿里云能够分担12306春节业务,也是因为阿里云实现了纯国产自研,包括用PC Server、数据库PolarDB等产品代替开源产品。

阿里云的去IOE战略除了催热国产公有云服务外,还间接造福了阿里云。因为早期无论是云梯1(以Hadoop为底层的集群)还是云梯2(以飞天为底层的集群)提供的系统存储和计算能力都是分布式。“所以尽管头两年,阿里云也有几次大规模的系统宕机,甚至机房停电,但客户的存储数据损失很小,几可忽略。”《云计算时代:本质、技术、创新、战略》一书作者鸣北林这样评价阿里云的战略成功。

第四、推出ET系列产品,参加各省份上云计划

今天阿里ET和数加等产品还未完全发挥威力,但是将云计算和AI、大数据能力输出,无疑是阿里云平台很重要的举措。

如今王坚博士主导的“智慧城市”概念正在杭州等城市落地,帮助国内城市或者类似吉隆坡等国外城市。打造类似全球三大智慧城市新加坡、伦敦和巴塞罗那的样板案例,是阿里云的下一阶段目标。

阿里云另一重要举措是利用政府关系和产品优势,参与各省市的上云计划。比如参与《浙江省“企业上云”行动计划(2017)》、《河南省智能制造和工业互联网发展三年行动计划(2018—2020年)》等各地计划,在云计算进一步下沉中获得优势。

  • 阿里云未来的机遇与挑战

阿里有战略定位错误的时候,比如直到2016年还在提倡自己是数据分享第一平台,事实上云计算早期承担的职责无疑是服务器的虚拟化,大数据无疑是后来的作用。未来阿里云的挑战,可能是以下几点:

第一是实现全球化,今天的阿里云已经在世界范围内形成47个可用区,但是显然业务主要服务国内出海企业,谈不上类似AWS的国际布局。

而阿里云的国际化步伐似乎也遇到了一些阻碍,2017年数据中心建设似有放缓,被腾讯云后来超越。成为3A并不稳固,未来Google或者IBM云都有借助全球业务后发超越的可能。

第二是在大型企业等传统领域站稳脚跟。目前国内大型企业还是有数据上云的顾虑,自建私有云和混合云成为潮流,尽管阿里云也在发展专有云等产品形态,但AWS帮助大家都上公有云的模式无疑是未来主流模式。

另外未来智慧政务、智慧城市、工业互联网和车联网都是未来具有想象力的市场。在这个市场,阿里云近乎和腾讯云、百度云同步启动,未来行业的竞争会十分激烈。

第三是正如亚马逊CTO沃纳·威格尔博士所言,云计算还是蓝海市场,国内云计算市场份额也没有稳固。百度云和腾讯云是意料之中的对手,如今京东云也开始发力,刘强东提出“京东云必须做成”,雷军也承诺未来投入10亿美元支持金山云发展。

另外进入2016年IT厂商开始发力,目前市场华为云、浪潮云、新华三都在集中发力。同时AWS和Azure也逐渐在国内站稳脚跟,2018年5月AWS宁夏区正式运营,光环新网和西云数据两家公司同步运营AWS,未来2年AWS市场份额挤进国内市场前二亦未可知。

今年“中兴事件”暴露出国内科技产业“缺芯少魂”的事实,不过阿里云的飞天系统是在云计算操作系统层面真正的国产自研产品。不止于此,聂万泉如此评价阿里云成功带来的意义:“中国云计算的发展就是阿里云带动的,从现实意义上说,没有阿里云中国的云计算发展至少还要滞后3-5年,相关的云计算、大数据技术都不会有今天的商用规模,更不会给国计民生带来如此显著的影响。”