据悉,今年“双11”期间,蚂蚁集团首次规模化应用了“绿色计算”,采用了三种资源调度技术实现算力共享,以降低数据中心的碳排放量。这三种技术分别是在离线混合部署技术、云原生分时调度、AI弹性容量。
近日,蚂蚁集团可信原生技术部负责人何征宇在接受媒体采访时表示:“前些年的‘双11’,我们的首要任务是保障平稳度过支付洪峰,因此会提前预留大量的服务器。然而今年,在保障支付洪峰平稳之外,我们还要做得更绿色,提高服务器的利用率,减少碳排放。参照谷歌数据中心减排相关实践,可以提高服务器的利用率到60%左右,蚂蚁接下来要达到这个目标。”
据了解,蚂蚁也给行业带来了很多开源的技术,如实现在离线混合部署的核心技术——Kata安全容器的强隔离技术。对于技术共享,何征宇还对《每日经济新闻》记者表示:“我们的基础组件都是开放开源的,比如说AI的容量预测可能会通过学术论文的方式开放出来,我们相信跟社会共享也是有利于自身技术发展的,我们想推动整个行业的发展。”
服务器利用率比三年前提高2倍多
在数字经济时代,算力正在成为新生产力。数据中心加工和处理海量数据,便利了生产生活,但是也消耗了大量电力。在2018年,全国的数据中心用电量就达到1608亿度,超过上海当年的用电量。
浙江大学信息技术中心主任陈文智认为,降低计算能耗,推动“绿色计算”十分关键。到底何谓“绿色计算”,目前尚没有权威的定义。有专家认为“绿色计算”包括:采用高效,节能和低功耗的计算设备和配套设施;在保证信息服务可靠性的前提下,合理分配计算资源;保障可持续发展的低成本,低能耗的新型系统与应用。
据了解,2019年,蚂蚁集团启动“云通未来”项目,开始系统性地探索绿色计算技术,提高计算资源的利用率、降低服务器数量。两年来,蚂蚁集团摸索出一套业内领先的资源调度技术体系,并且逐步将这三种技术应用在日常场景之中。三个核心技术分别为在离线混合部署技术、云原生分时调度技术、AI弹性容量技术。
“本质上我们的业务量每年都会增加,但是,保障同等业务规模需要的机器数并不会增加。通过技术的方法,每年都会增加机器的容量和利用率。”何征宇表示,得益于绿色计算技术的应用,蚂蚁集团的服务器利用率比三年前提高了2倍多。
今年“双11”,蚂蚁集团也将大规模应用这三种绿色计算技术,通过算力共享,提升资源统一调度效率。何征宇表示,比起去年,人力上减少了30%投入,整体“双11”备战时间成本也下降15%。“我们已经邀请中环联合认证中心(CEC)对蚂蚁集团在‘双11’期间的减排量进行盘查和测算,相关数据会第一时间和大家同步。”
今年3月,蚂蚁集团宣布了碳中和目标,承诺在2030年实现净零排放。
绿色计算技术将向行业输出
“我们假设任务分为在线和离线两种模式,在线任务需要实时进行计算处理,比如在线支付;离线任务则不需要对任务进行迅速响应,可以稍晚进行计算的业务,比如商家对账单。”在阐述在离线混合部署技术时,何征宇表示,可以把在线业务理解成是机动车,离线业务则是非机动车。如果硬要把他们合并在一起,就容易发生安全事故,整条道路的运行效率也会降低。
因此,传统的做法是把在线任务和离线任务分开部署在不同的集群,然而这样导致的结果往往是在线任务的服务器资源没有被充分利用,却消耗了大量电力。
为此,蚂蚁集团在业界首次将Kata安全容器的强隔离技术,实现离线任务与在线任务在调度系统内的混部,通过“削峰填谷”解决资源利用率问题,做到了“数据中心是一台智能的计算机”。他解释,这里最关键的技术就是当离线的作业调度上来的时候,在同一台计算机内不会影响在线服务,即便服务器CPU利用率非常高的时候,每一次支付还是在1秒内完成。
比如在“双11”交易高峰时,可以暂时减少对“离线服务”(不是实时需要、对时效性要求不高的服务)的处理,同时将更多计算资源调度至处理交易结算这种“在线服务”。在高峰期“削掉”离线服务的计算量,在低谷期(比如凌晨)重新开始处理离线服务的计算量。
在何征宇看来,云原生有两个核心目标,一个是资源效能,一个是研发效能,这两者肯定是一个科技公司的核心生产力。“我们现在离谷歌还是有差距的,但是我们在追赶的过程中,而且差距也没有那么大。”
何征宇在受访时还告诉《每日经济新闻》记者:“我们的基础组件都是开放开源的,比如AI的容量预测我们可能会通过学术论文的方式——共享方法论,因为整体上有非常多的技术点。”对于技术共享,何征宇认为,会尽可能开放更多的技术,这有利于自身技术发展,也将推动整个行业的发展。
作为服务几亿用户的平台,每分钟都在对海量的数据进行处理和计算。何征宇表示,每年“双11”的活动和玩法都会变化,“双11”是一个周期,每天都有无数小高峰。“其中主要挑战是在减少服务器用量的同时,保证业务稳定和用户体验不变,这是难点。”他坦言。
(文章来源:每日经济新闻)
文章来源:每日经济新闻