对于码字工来说,如果灵感缺乏,上极术社区溜达溜达,总会有收获。笔者在极术社区的最新推荐栏目中,发现东数西算设施白皮书的阅读量和下载量都非常高。作为国家级的算力工程,东数西算的未来发展备受关注。
今年开年,国家发改委联合多部门宣布同意东数西算工程的建设,包括在京津冀、成渝、内蒙古、贵州、宁夏等八地启动建设国家算力枢纽节点,并规划张家口集群等 10 个国家数据中心集群。
数据中心是促进 5G、人工智能、云计算等新一代数字技术发展的数据中枢和算力载体,助推着数字经济的增长。对于数据中心来说,核心的构成 —— 芯片,可谓其最为关键的组成部分。
数据中心作为国家数字经济发展战略的重要部分,其集成化、绿色化、智能化的发展,对于芯片也提出了许多要求。很多读者都比较关心东数西算工程驱动下芯片的发展情况。
东数西算,这个大规模算力工程的实施,推动着高算力、高性能芯片的市场发展。在国际局势的复杂变化中,对于国产芯片厂商来说,该如何突围拿下市场呢?
作为数字经济的重要“基础底座”,数据中心在经济和社会发展中扮演着重要的角色。同时,数字经济的全面开启与绿色可持续的发展需求,对数据中心提出了更新、更高的要求。《新型数据中心发展三年行动计划(2021-2023 年)》《“十四五”信息通信行业发展规划》等在内的多份政策性文件指出,新型数据中心要从高技术、高算力、高能效和高安全四大方面出发,实现高质量发展。在政策的要求与指引下,数据中心迎来了革新,对芯片也有了新的需求。
东数西算工程是重要的新型算力基础设施,在助力千行百业数字化转型的过程中,芯片是基础。数字经济的发展离不开数据的驱动,其中涉及许多政府、金融、通信等行业的敏感数据。底层算力设施对 CPU 的首要需求是信息安全保障。
其次是高性能的需求。数据中心可以对数据进行集中的管理,也就是数据的交换、计算、存储等。其中计算是数据中心的核心功能。芯片性能的提升,不仅带来智能化与高效的服务,也能助力数据中心的绿色化发展。
据前瞻产业研究院数据,数据中心的耗能部分主要包括 IT 设备、制冷系统、供配电系统、照明系统及其他设施。由服务器、存储和网络通信设备等所构成的 IT 设备系统所产生的功耗约占数据中心总功耗的 45%,其中服务器系统约占 50%,存储系统约占 35%,网络通信设备约占 15%,空调系统产生的功耗约占数据中心总功耗的 40%。我们可以看到,对数据中心 IT 设备服务器系统的升级对数据中心的低碳化发展意义重大。服务器性能与功耗的优化,就意味着单位能耗的降低。
最后是与其他技术的融合。比如与密码学技术的融合,可以保障数据的安全隐私。数据中心流量的激增,安全问题的复杂程度与范围都变大了。传统用软件进行加解密的计算非常消耗 CPU。通过将安全技术与专用的模块硬件或 DPU 连接,将过去在 CPU 的算法去卸载到专用引擎上,可以释放 CPU 内存的同时提升加解密性能。
高性能、易融合等这些新型数据中心主要的芯需求,也为国产芯片厂商的发展勾勒出高性能芯片的大致方向。结合自身的优势特长,芯片厂商需要在数据中心如火如荼的发展中寻求突围。
数据中心的集成化发展,处理的数据、资源的管理任务变得复杂。这也对芯片的数据处理能力提出了要求:更大的带宽与更大的存储。
数据的整合传输、分布式计算等也是必不可少的方式。在复杂的国际局势中,外部的供应环境多变。对于国产芯片厂商来说,要达到像国外技术标准较高的芯片水准,国产芯片厂商一方面需要在芯片底层架构的创新、制程工艺方面等方向发力。现有的指令集架构,海外巨头更加具有优势。在架构设计方面,国内芯片厂商还有升级增长的空间。通过底层架构的创新与制程工艺的迭代来实现计算效率的数量级提升。
一些芯片厂商趟上了这条道路。国内某芯片厂商的 DPU 已经流片。传统数据中心以 CPU 为核心架构,DPU 的出现以更专的性能满足数据中心计算、数据处理等需求。随着软硬件架构的深入融合发展,DPU 将会成为众厂商争先发展的下一代数据中心核心计算单元。
当然,现实的情况并不是所有的芯片厂商都可以完成独立完成芯片架构设计与研发。应用成熟设计模块的 IP 或产品服务也是许多企业的选择。例如可供选择的第三方 IP 企业安谋科技、锐成芯微等。安谋科技提供的 IP 设计与自研产品,可以为许多芯片厂商定制高性能芯片并提供服务。从手机、PC 乃至排名世界第二的超级计算机富岳,都能看到基于 Arm 架构的高性能芯片。借助这些第三方厂商的势能,国产芯片厂商也可以更快地迭代创新。
在数据中心处理器之外,芯片厂商的思路也可以前置到数据流入数据中心前的各大边缘设备中,在各类边缘处理器上发力。厂商可以考虑通过提升边缘设备 CPU 性能、降低集成 SOC 芯片功耗等,整体提升边缘设备计算的能力,减轻数据中心处理数据的压力。比如在一些高功耗场景中,通过高度集成化、低功耗的设计,将各类接口集成在单芯片中,定制化算法来降低功耗;设计通用处理器作为专用设备,为一些场景提供算力服务,提升边缘设备的算力等。
对于芯片厂商来说,也需要重视产业链上下游的协同。芯片产业的整体产业链条冗长,覆盖的门类广。许多国产芯片厂商,较为擅长的是芯片设计的能力,但产能方面的能力欠缺。高性能芯片行业的发展需要产业链上下游的协同。厂商可以选择通过战略合作、产品技术支持、协作项目等形式,推动行业软硬件、解决方案、工具链、行业标准等生态环节的发展,最终实现促进自身的迭代。
这些突围路径落在纸面上讨论看起来轻飘飘,对于国产芯片的发展来说,都是大山一样的存在,难以翻越。在半导体这个行业里,市场格局一旦定型,几乎就很难打破。每一个产业突破与难点的展开,都需要堆砌大量的资源与创新。国产芯片的突围道阻且长。而面临未来算力网络的部署,也有不少的问题待解决。
随着数据中心节点的部署完成,算力网络的构建也在推进中。中国算力网智算网络已经上线。东数西算的枢纽节点,各地的智算中心、超算中心未来都会陆陆续续并入到算力网络中,形成一张随时取用算力的便捷大网。
对于数据中心来说,未来分布式的数据中心节点将由算力网络连接起来,统筹分配和调度计算任务,实现算力价值的最大化。面对复杂多变的数据跨节点传输与调度等,国产芯片厂商还需要解决这几方面的问题。
供需双方的交流与匹配。面对不同规模的数据中心与多种功能的芯片,双方的需求信息较为模糊,芯片厂商需要解决与数据中心方沟通不充分的问题,最终实现互相匹配契合的需求与服务。
数据跨数据中心节点的调度与流动,对芯片的性能如压缩、解压能力的提升有一定的要求。海量的数据需要在传输前压缩,在存储前解压,需要芯片厂商提升芯片无损压缩的技术。
通用的边缘算力产品方案。边缘计算的场景多,设备多,需求量大,对 CPU 性能与功耗要求较高。比如面对算力要求较高的场景工业互联网、远程医疗、智能汽车等,芯片厂商需要提供更加通用的边缘算力产品方案。提升边缘设备服务器的适配性与易用性,便于实现端到端的自动化部署。
东数西算工程,会给高性能芯片市场会带来波动,但不会带来产能井喷式的发展。更多的层面是对芯片本身性能方面的提升,也就是从算法和硬件两个方面的同时优化。芯片厂商需要提升自身软硬件协同的能力。
围绕着数据中心,东数西算工程与一体化算力网络的建设,这些算力设施的构建带来机遇的同时挑战也不少,留给国产芯片厂商突围的时间紧迫。这是场对芯片厂商的综合大考。既要快速上马,服务好东数西算工程,也需要在这个竞技场中留下来交出答卷。这场战役中,没有喘息的空间。复杂多变的芯片市场,各路队伍已经集结完毕,向着内心描绘出的蓝图开启了冲刺跑。
本文来自微信公众号:脑极体 (ID:unity007),作者:燕良