图源:图虫创意
编者按:本文来自微信公众号蓝洞商业(ID:value_creation),作者郭朝飞,创业邦经授权转载。
未来所有数据上云,每个人、每个企业在云上有一个专属空间,阿里云却希望能越做越薄。
10月19日,2021杭州云栖大会,阿里云发布自研云芯片倚天710。倚天710采用5nm(纳米)工艺,单芯片容纳600亿晶体管;在芯片架构上,基于最新的ARMv9架构,内含128核CPU,主频最高达到3.2GHz。
用阿里云智能总裁张建锋的话说,这是阿里第一颗为云而生的CPU芯片,将部署在阿里云数据中心。
这也意味着阿里云在芯片领域更进一步,拥有处理器IP、AI芯片及通用芯片等系列产品。
2019年,阿里旗下半导体公司平头哥先后发布RISC-V处理器玄铁910、阿里第一颗芯片含光800。目前,玄铁系列处理器出货量达25亿颗,含光800也实现规模化应用,通过阿里云服务于搜索推荐、视频直播等行业。
阿里云是否有意大规模涉足半导体行业?
“我们是Focus(聚焦)在云计算,不是Focus在半导体。阿里云到目前为止是一家云计算厂商,如果市场上有更好的选择,我们当然会采用市场上的解决方案。今天我们做的很多工作是为了完善云计算,并不是为了完善芯片这个产业,可能当下前面一个选择是我们最重要的选择。”张建锋向「蓝洞商业」等坦陈。
但不可否认的是,围绕云计算,阿里云涉足的领域越来越多,从IT基础设施,到中间的软件层、用户端,从软件到硬件,从芯片、云操作系统、服务器到大数据、AI、IoT等,几乎无所不包。
作为一家云计算厂商,阿里云是否有边界?边界又在哪里?
倚天710的出现,是因客户需求驱动的。
云是高性能服务器芯片最大的应用场景,阿里云在服务诸多用户的过程中,发现经常会有一些特殊需求,主要表现为大规模、多线程、高并发。
张建锋很清楚,“CPU并不完全为了云上负载来设计的”,要更好满足客户需求,提升阿里云的技术能力,有必要针对性地设计一款全新的芯片。
2017年,阿里成立达摩院,芯片是其核心研究方向之一。达摩院组建了一支芯片研发团队,由半导体行业工业界和学术界专家组成,研究方向涵盖系统架构、计算技术、存储技术以及芯片工程等核心芯片设计技术。第二年,阿里收购中天微,其是中国大陆唯一拥有自主嵌入式CPU IP core的公司,由此阿里掌握了芯片底层技术能力。很快,达摩院芯片研发团队与中天微团队合并,成立平头哥。
目前,全球芯片架构主要包括X86、ARM与RISC-V。英特尔的X86架构主要用于PC与服务器;ARM更多的是智能手机与物联网;RISC-V是开源架构,出现于2010年,为一家非营利基金会所有。
芯片要执行软件程序,必须将软件或程序语言翻译成硬件指令,这套标准规范就是芯片架构(指令集)。相关公司要采用哪种芯片架构,需要专利授权,IP授权费用经常会达到百万、千万美元。在服务器芯片架构上,X86仍然占主导地位,长期与微软结盟,但ARM架构逐渐受到亚马逊、苹果、华为等公司的青睐。
阿里云的倚天710采用了ARM架构,针对云场景的高并发、高性能、高能效需求,将芯片设计技术与云场景相结合,实现突破。张建锋解释,CPU一类是单核强性能,一类是多核,从测试的结果来看,云上负载多核明显优于单核强性能,因此倚天710含128核。
张建锋承认,含光800是ASIC(用于供专门应用的集成电路)芯片,其功能、复杂度与通用芯片有很大的不同,倚天710对阿里云能力是一次很大的考验。
一是大型工程的管理能力,短时间内一款芯片从无到有,流片回来到测试,涉及多种新技术。二是考验对技术的判断,并不是买一堆东西就可以生产,要在很多架构与配合间做选择,考验着设计技术能力。三是从芯片设计到交付,要克服很多问题。
“在芯片领域里推进下去,能不能对所有IP满足规范的情况下,全部用自己来实现,这个可能是接下去我们新的挑战。”张建锋说。
倚天710是阿里云推进“一云多芯”策略的重要一步,飞天操作系统正全面兼容X86、ARM、RISC-V等多种芯片架构,希望满足客户多样性的计算需求。也因此,倚天710芯片并不出售,主要是阿里云自用。阿里云反复强调,将继续与英特尔、英伟达、AMD、ARM等合作伙伴保持密切合作,为客户提供更多选择。
平头哥技术战略副总裁高慧向「蓝洞商业」等分析,平头哥现有业务主要是两大类:一类是做SOC(系统级芯片),主要以数据中心芯片为主,包括含光800与倚天710两个产品线。
另一类是玄铁的IP和业务。数据中心的芯片主要是服务阿里云业务,本着“一云多芯”的战略,所以倚天这颗芯片采用了ARM的架构。
平头哥副总裁孟建熠补充说,数据中心就是自研,软硬一体按照云原生走下去。端侧比较碎片化,东西也比较多,以IP开放的方式让别人一起接入,构建大的生态系统,更好赋能数字化转型。
目前来看,阿里云做芯片主要是围绕云计算,解决自己的问题。
走过十二年,阿里云的规模在扩大,边界在扩展。这种变化与云的演化有关,最早的云计算可能只是部分IT技术与基础设施,如今云计算已经与数字化转型紧密结合。
在张建锋看来,云计算向下定义了芯片、网络、存储,向上重构了操作系统、数据库、大数据应用等一些基础核心软件的发展和演化路径。
云计算可以分为三个层面:第一,云计算逐渐成为IT的核心,而不仅仅是它的组成部分;第二,软件开发层面,如何赋能工程师;第三是如何连接终端用户层面,也就是连接业务的层面。
“这些阿里云都有布局,我们有自己的云计算。”张建锋说。
不过,这并不意味着所有的东西阿里云都要自己做。张建锋认为,云计算本质上既是SaaS化的服务,也是一个生态。生态的最大特点是,平台上的很多服务都是别人提供的,阿里云的很多能力也并不是阿里云在做,是别人放到阿里云上,服务共同的客户。
当前的商业模式并非如此理想,很多时候阿里云还在向客户卖产品、做项目交付,到现场进行运维,处理各种问题,远没有到SaaS化阶段。互联网行业之外的很多客户,还要叠加更多工具与应用,也因此才有了云钉一体,来承载那些企业的业务数字化与组织数字化转型。
“阿里云到底做多厚多薄?其实任何一家企业都想做得越薄越好,越薄又是一个生态,这是大家追求的目标。阿里云的云服务想做什么?我就想做一个云服务的提供商,不想做其他任何事情。但是今天客户的成熟度不一样,你必须给他做更多的工作。”张建锋坦承,其实阿里云是想越做越薄,越做越回到技术本身。
围绕云计算的核心技术,是阿里云的里子与底色。
今年上半年,阿里云提出“做深基础”,一方面是整个云计算的软件部分;另一方面则是软硬件结合的部分,要支撑软件系统,就要求更新硬件,包括IDC、交换机、服务器等。
飞天操作系统是阿里云的基础与核心,此外还包括多项自研技术,比如神龙计算平台、盘古存储平台、分布式数据库PolarDB、自研云交换机、液冷数据中心、MaxCompute大数据平台等。
2021年云栖大会期间,除了倚天710芯片,阿里云还推出磐久自研服务器;对外开放大数据+AI一体化平台“阿里灵杰”,帮助企业和开发者实现“开箱即用”;基于“阿里灵杰”,达摩院开发了超大规模多模态预训练模型M6,主打多模态、多任务能力,其目标是打造全球领先的具有通用性的人工智能大模型。
即便如此,阿里云坚持开放与开源,避免封闭与垄断。比如,虽然自研服务器、交换机等,但主要是设计,而且开源,并不生产。目前阿里云服务器最大的提供商是浪潮,交换机最大提供商是锐捷。
在云原生领域也并非全部亲力亲为。“云原生还是以合作为主,我们会选几个进入门槛比较高的,其他还是以合作为主。”阿里云基础产品事业部负责人蒋江伟向「蓝洞商业」等透露。
有了稳固的内里,阿里云的边界会随着云计算的外延而扩展。
张建锋认为,云经历了第一和第二阶段,类比就像出现了电和电网,传统IT被云取代,但真正的改变还没到来。未来将出现无数的云上新物种,完成了基础设施的建设,将看到“电器”爆发一样的时代机遇。
云、网、端正在融合。拿阿里的“无影”来说,其只有名片大小,适配所有屏幕,连上阿里云就是一台超级电脑。用无影做编程,数据在云端,不用本地电脑存储,也不用担心核心代码泄露,无需购置高配硬件,随时随地可以使用无限算力,处理各种复杂计算需求。
“未来所有数据都将在云上,不管你用什么样的设备、有多少设备,每个人、每个企业在云上有一个专属空间,所有的计算负载可能都在云上发生。未来,端的形态将变得更轻薄、更友好,以满足随时随地的创新。”张建锋如此猜想。
云计算越来越厚,阿里云希望变薄。