12306避免崩溃的秘密:爬上阿里云
2015年春运火车票售卖量创下历年新高,而铁路系统运营网站12306没有崩溃。这背后是12306与阿里云的合作。
2015年春运售票最高峰日出现在2014年12月19日,12306网站访问量(PV值)达到破纪录的297亿次,平均每秒PV超过30万次,当天共发售火车票956.4万张,其中互联网发售563.9万张,占比59%,均创历年春运新高。
12306这次扛住了大并发请求的集中轰炸。
具体原因是,12306把余票查询系统从自身后台分离出来,在“云上”独立部署了一套余票查询系统。余票查询环节的访问量近乎占12306网站的九成流量,这也是往年造成网站拥堵的最主要原因之一。
把高频次、高消耗、低转化的余票查询环节放到云端,而将下单、支付这种“小而轻”的核心业务仍留在12306自己的后台系统上,这样的思路为12306减负不少。
高峰时期的12306号称世界上最繁忙的网站。一位云计算行业资深人士对《第一财经日报》记者说,电商网购的订单和球赛门票、演唱会门票、机票等比较类似,自身维度较少,系统处理的难点在大规模的集中并发;但火车票的不同点在于,一条线路从起点到终点,中途任意站点均可生成一张票,维度的增加带来了复杂度的几何级数增长。
独立第三方的云服务机构正在试图从中找到商机,阿里捷足先登,后者自身的云服务已经历过“双11”购物节考验。“两者的共性一个是大并发(指大规模集中请求),二是都需要弹性计算。”该人士对记者说,这就构成了12306搭载阿里云的契机。
借用阿里云内部的一个形象比喻,云计算好比一群小牛拉一架车,车上的货装多了,就多加几头小牛来拉,某头小牛不听话了,就用其他同伴替换它,弹性、灵活、可调度;而原来的IT架构是一头大牛拉这架车,大牛买来后,能拉多少货是一定的,货突然多了,或者大牛生病,车也就抛锚了。
铁路信息系统是一个覆盖了全国各个分局系统的庞然大物,这次单把余票查询与其他业务在逻辑上进行独立,使用云计算来处理,不需要对整个网站的业务架构做颠覆性改造,能做到“即插即用”,这对12306来说是可接受的。
一位业内人士19日对《第一财经日报》记者说,余票查询是一个相对独立的模块,容易迁移到云端,且这块又是高峰时段最吃紧的业务环节,因此先把余票查询独立出来是顺理成章的。
据记者了解,12306和阿里云的双方技术团队在一起沟通了已有一年时间,至于今后在技术(比如支付环节)和业务层面(比如火车票能否在淘宝上购买)上是否还会有更进一步的合作,阿里云内部人士19日并未向记者透露。
业内人士猜测,12306和阿里云的合作只是第一步,毕竟已运转多年的12306系统不是在云计算上原生的架构,有很多细节还不适应云计算平台,而阿里云提供的是一整套解决方案,未来像数据库、安全防御等领域也可能会与阿里云合作。
在12306之前,类似政府层面的系统“上云”已有不少案例。比如去年11月,运行在阿里云计算上的“中国药品电子监管网”通过了信息安全等级保护三级测评。这是全国首例部署在“云端”的部委级应用系统。
上海交通大学安泰管理学院教授王理平称,云计算是在一个远远高于原来规模数量级上配置IT资源,展示了IT资源云计算方式整体配置的巨大应用潜力。许多在局部IT资源配置下不能完成的难题,在云计算时代都可以一一克服。
在眼下这轮去IOE(指IT系统摆脱对IBM的小型机、Oracle数据库、EMC存储这个“黄金三角”的过度依赖,转而用弹性计算方式满足IT需求)、推行国产化系统的顶层设计声势下,目前工信部针对云计算的“十三五”规划已经启动,政府采购云服务方案近期有望试点。在试点推进的过程中,未来政府机关将逐步降低对国外厂商的依赖,提高本土企业的市场占有率。
可以说,中国庞大的用户群是云计算的最佳检验工具。之前就有专家表示,美国的云计算系统移植到中国不一定成功;但能在中国运行的云计算系统推广到全球,一定会成功。
记者了解到,作为马云“押宝”下一个互联网行业变迁的重要角色,阿里云在2013年即实现了同时运营服务器规模达到5000台的“飞天5K”。目前在全球范围内,这一能力仅有亚马逊、谷歌和雅虎掌握。目前已有12个省、直辖市与阿里云签约合作,欲在数字城市等领域施展身手。接下来可谓阿里云的最佳机会。