云计算系统故障年年有,如今亚马逊AWS又多了一次。
据外媒报道,亚马逊旗下云计算服务遭遇大面积故障,导致迪士尼流媒体订阅服务迪士尼+、Netflix、Slack、Robinhood和美国最大的加密货币交易所Coinbase等服务出现故障,甚至于直接牵连导致亚马逊自家快递业务瘫痪。
作为目前全球排名第一的云计算企业,亚马逊云计算业务的一举一动都紧密牵连着整个行业乃至全球科技产业的神经。
突发意外后,受影响的服务什么时候得以恢复?企业通过云计算技术提升业务运营又该注意些什么呢?
AWS平均每年故障达2.4次
据Garnter统计数据,2020年,亚马逊云计算业务以40.8%的市场份额大幅领先、位居全球第一,远超排名第二和第三的微软云及阿里云。然而,在市场份额不断提升的同时,有关于亚马逊云计算业务安全及突发故障等情况,也频频引发外界关注。
此前,有关于亚马逊云业务出现大规模突发故障的事件,便有多起发生。
今年9月,亚马逊网络服务公司表示,其在日本的云服务出现故障,扰乱了从网上经纪商到航空公司等众多公司的运营。据传,当时包括日本航空公司以及日本气象网站在内的公司均受到影响,在网上券商中,松井证券公司的股票报价发布被推迟,SBI证券公司和乐天证券也受到影响。
此外,2020年11月,亚马逊AWS遭遇了持续数小时的故障,同样导致部分网站和服务系统崩溃,一度影响了包括Adobe Spark、Anchor、Coinbase以及《华盛顿邮报》等在内的二十多家机构业务运行。
而在更早的时候,2017年亚马逊AWS云存储服务S3也曾出现大宕机,当时,一名程序员在调试系统的时候,运行了一条原本打算删除少量服务器的脚本,结果输错了一个字母,导致大量服务器被删,该错误持续了4个小时,牵连面甚广……
有业内人士曾整理过一份亚马逊2010年到2019年期间发生的宕机,结果显示,从2010年至2019年间,亚马逊累计出现过22次突发故障,平均每年故障次数达2.4次。作为全球最大的云计算企业,亚马逊AWS有着全球最高的市场份额,但不断频发的安全事故问题,却也同样惹人注目。
业务不应放在同一“篮”中
在国内,在经过2009年以来国内云计算产业的集体爆发之后,目前包括阿里、腾讯以及华为等企业,在云计算方面的布局也取得了一定成就,同时在国际上也开始展现影响力。
据国际研究机构Gartner报告,2020年,全球云计算IaaS市场中,阿里云排名全球第三、全球市场份额达9.5%,过去五年市场份额上涨近3倍,超越谷歌云位居全球云计算行业前列,成为国内云计算行业市场发展的代表。
但是,在国内云计算行业取得高速发展的同时,一些安全故障等问题也随之发生。
今年4月,华为云首次突发大规模“宕机”故障,一时之间,“华为云崩了”、“华为云挂了”等话题涌上热搜榜。多位网友反映,华为云官方网站登录不上去,管理后台无法访问,服务器暂时过载并且出现连接错误等提示。而在此之前,有关于腾讯云、阿里云等云业务发生安全故障也已多次发生。
实际上,企业上云,已经成为不可避免的最新趋势。
但在这一过程中,安全问题也正在成为越来越多参与者们着重考虑的问题。“云安全无小事,一旦云服务出现宕机,不仅影响到企业的生存,也会对用户体验造成破坏”,有业内人士评价称。
在该人士看来,无论是国内还是国外,云厂商们频繁发生的宕机、数据丢失等意外事故,从根本上来说仍然是云灾备、数据管理等安全意识及防范能力不强。
或许,为了避免意外事故发生时产生致命伤害,企业们应该更加学会“不将业务放在同一个篮子里”,而是选择多个云服务进行“多云”部署,进一步增强企业IT系统应对风险与备灾的能力。