携程,艺龙喊你回家补补钙

郑凯 2015年07月06日 20:47

 一段12个小时的狗血剧情,一会员工误操作,一会是服务器网络故障,各种消息飞来飞去,整整一天过去了,还没完全发酵。要怪就只能怪,你自己缺钙。同期遭遇瘫痪危机的艺龙,凭什么能短时间爬起来?赶快喊携程回家补钙吧。

时间危机

12个小时,对携程这家成立已近16年的公司,并不算长。可是5月28日的从网页端到APP全面的网络瘫痪,这黑色12小时,简直是携程16年来最难熬的12个小时。

528,真是个神奇的数字,刚刚被携程并并购了37.6%股权的艺龙,同一天也发生了短暂的瘫痪事件。可不同的是,仅花了14分钟,艺龙就顺利度过了危机。

时间其实是一种危机,尤其在企业级的数据中心领域,有一串9来代表安全性,这代表着一种时间的危机,比方说安全性如果是5个9,也就是99.999%。那么意味着一年中,会有5分钟左右的停机时间。但是如果达不到5个9,那这个时间会相应放大。一旦过长,就危机重重。

当然,每个IDC都号称自己是5个9,甚至6个9,但过往的经验告诉我们,理论上安全性,在实际应用当中,确实无法衡量。

就比如,携程所说的员工误操作。

携程发布一份官方声明称:“28日上午11点09分,携程官方网站及APP暂时出现无法正常使用的现象,经过技术人员抢修,在当天28日23点29分,携程官方网站及APP已经全面恢复正常。对于网上关于‘数据丢失’等一些谣言,携程多次郑重声明,数据没有丢失,预订数据也保存完整。”

在携程受到攻击后,携程在首页上方提示,消费者可以前往艺龙旅行网进行消费。但不久之后,艺龙旅行网首页也无法访问。后经艺龙官方微博回应道,“因遭受网络攻击,艺龙网首页出现部分用户无法访问的情况,目前已恢复正常”。

我只想说,离奇的剧情太过复杂,要小心你心脏的承受能力。员工的一次误操作,相比恶意DDOS攻击,两者谁轻谁重?5个9的安全保障,毁于员工鼠标一点。这是员工的权限足够高,还是携程的系统足够脆弱?

希望下次不要出现扫地大妈不小心拔掉数据服务器电源的故事出现吧。

事后,有评论人认为,这仅仅是一次内部事故,不存在技术问题。12个小时的时间危机,带给一家百亿市值公司的,不该是检讨吗?如果一家百亿市值的公司,想要建千亿规模的运维团队,这真的现实吗?

楼够高了 地基够强吗?

事实上,如果不是12个小时,这么长的时间危机,携程作为中国最大的旅行网站,其实也时常发生非常低级的网络安全事件。

有人说,这都是钱闹的。现在的互联网公司,肯大价钱请产品经理,却不愿意花钱找个好运维。当然,这种经典的吐槽,这几天已经变成段子满天飞了。

我更同意另一个观点,说“携程,你让他玩两地三中心,虽然绝对安全,但是成本根本不现实。”

回头看艺龙,艺龙网在携程故障后遭受了大流量DDoS攻击,网站服务一度受到影响。艺龙网紧急接入腾讯云大禹系统,过滤攻击流量,将正常流量引入网站。仅14分钟,攻击流量被清洗,艺龙网服务恢复正常。

这从技术的角度,提供了一个思路,如今的互联网公司都面临着业务的高速发展的过程,某些移动互联网公司的业务量激增甚至相隔一天,流量会翻上三倍。这表示,IT系统的发展肯定会落后于业务的发展,除非你肯定静下心来自己设计,你等得起,业务等不起,风投更等不起。

很多从传统PC端走出来的公司,都是自建IT系统,互联网公司的技术基因使然,让他们多数相信自己的技术能力。可是,理想那么丰满,现实却真的骨瘦如柴!业务移动化以后,原有的IT系统,绝对无法满足要求。无论是弹性还是安全性,都没办法保障。

某些互联网应用,一天一小断,三天一大断。服务器问题,网络问题,存储问题,多了去了。如果不是携程出了这档子事,估计很多圈外人根本不知道现在很多互联网公司的后台之脆弱。用某个网站IT经理的话讲,“每天都在走钢丝,不知道哪天掉下来,然后永远起不来”。

可怕吗?用业务盖起了一栋楼,却因为IT系统的地基不够劳,整个崩塌。对于互联网公司,事实就是这么残酷,像艺龙这样通过引入腾讯云的云服务来替代自身的一些技术基础建设的方式,在互联网公司业务的高速成长期,是可取的。

腾讯云,阿里云,这些提供公有云服务的企业,提供了一种选择。互联网公司,可以去专注你的业务,IT系统和安全防护,可以交给云服务商去做。比如滴滴打车,作为今年成长最快的互联网公司,它的很多云服务都是跑在腾讯云上的。

互联网公司,已经走到了新的阶段,IT系统的压力,有可能变成业务发展的瓶颈。像携程一样,如果问题发生了,除了从自己身上找问题之外,要不要学着补补钙呢?用其他公司的云服务营养,让自己的基础变得更强。

推荐文章