DEMO WORLD世界创新峰会上,沐曦集成电路(上海)有限公司联合创始人兼COO程刚发表了《国产高性能GPU打造算力新标杆》的主题演讲
整理:赵晓晓
编辑:及轶嵘
2022年7月28日,DEMO WORLD世界创新峰会在北京开幕,并以线上直播形式举行。
此次峰会由创业邦主办,会上邀请了多位知名跨国企业、本土大企业、创新企业以及产业投资人,他们将就当前产业创新技术、模式、现象等议题进行分享与对话。
同时,创业邦研究中心还将基于大企业创新理论与实践,发布2022年上半年全球独角兽企业发展研究报告、2021中国企业风险投资(CVC)发展研究报告2021中国最活跃CVC
等系列内容,为企业提供基于睿兽分析数据库的数字化的创投、技术和商业参考。
DEMO WORLD世界创新峰会上,沐曦集成电路(上海)有限公司联合创始人兼COO程刚发表了《国产高性能GPU打造算力新标杆》的主题演讲,犀利观点如下:
1. GPU是全球算力的支撑载体,也是全球算力的支撑基础。
2. 不管是在东数西算的布局上,还是在各个应用领域,包括未来超级运算领域各个方向的需求上,我们都需要有一个非常强力的中国芯GPU的布局,只有实现高性能GPU的自主可控,才能保证国家基础算力平台的安全性和自主性,才能为中国提供一个非常强大的数据算力支撑。
3. 仅仅有GPU的硬件也是不够的,因为硬件是基础,软件才是整个应用系统的灵魂。
以下内容由创业邦整理:
对GPU的强劲需求
从数据上来看,2020年到2025年,我们对算力的需求是过去十年的3倍,而且这个需求还在持续增加。GDP的增长跟算力是成正比的,也需要算力进行支撑。所以算力作为新基建的重要组成部分,对国家未来的发展会产生非常积极的影响。
那么,GPU为什么重要?
当前最流行的算力实现组成是以GPU加上CPU的方式作为一个组合,来引领未来的通用算力平台。
从配置上来看,GPU和CPU虽然用的都是冯·诺依曼架构,但是微架构是不一样的,GPU更倾向于对并行算力的实施。
所以从目前比较主流的算力平台搭配方式上来看, CPU和GPU的这种方式是目前能够实现大规模算力提升的一个最佳方式。基于这种方式,可以对当前社会算力需求提供强力的支撑。第三方机构做了一个预测,2020年到2027年,全球对高性能GPU的需求年均复合增速能够达到30%以上,而且增速还会继续往上提升。2020年全球GPU市场的总价值超过了250亿美元,预计2027年会达到2,000亿美元,年均复合增长率超过30%。从市场角度来看,这是一个非常好的赛道,也是有广阔市场需求的一个方向。
从应用领域上来看,汽车、航空航天、船舶、工业机械、新能源、电子辅助设计和模拟,也包括金融、投资分风险分析、宇宙探索、地球的开发、地质勘探、数据的处理或仿真,等等,都需要强大的算力来支撑。还有我们在数学、物理等基础学科方面,生物医药方面,比如对新药的研制、对病毒的研究等方面也都是需要有非常强的算力需求。
从三大应用方向上来看,游戏和虚拟世界,元宇宙方向主要体现图形图像显示和渲染的应用;人工智能应用方向,GPU也在拉动整个产业规模的快速增长;数据中心应用方向,国内建立的东数西算工程,GPU也起到了非常重要的角色。GPU既是全球算力的支撑载体,也是全球算力的支撑基础。
(备注:东数西算工程,指通过构建数据中心、云计算、大数据一体化的新型算力网络体系,将东部算力需求有序引导到西部,优化数据中心建设布局,促进东西部协同联动。)
对中国来讲,有超量的数据计算的需求,也有数据安全的需求,所以不管是在东数西算的布局上,还是在各个工业领域,包括未来高性能运算领域各个方向的需求上,我们都需要有一个非常强力的中国芯GPU的布局,只有实现高性能GPU的自主可控,才能保证国家基础算力平台的安全性和自主性,才能为中国提供一个非常强大的数据算力支撑。
人才和团队
对芯片研发而言,如果仅仅靠概念去研发出一颗芯片是很容易的,但是想把一颗芯片从概念然后一直引入到量产,还要符合客户的实际应用需要,能够完成整个系统平台的打造,包括在应用过程中解决客户各种各样的问题,这个是非常困难的,非常需要有经验的团队。
沐曦是在2020年9月成立的,公司成立之前,团队的核心成员在GPU领域已经深耕近20年,整个团队平均有10年的工作经验。大家在一起工作已经完成了磨合,这保证我们今后的产品能够少交学费,避免走很多弯路,是实现顺利量产得充分保障。设计芯片容易,实现芯片的量产比较困难。沐曦有非常坚实的研发基础。
团队以前实现的产品记录上,从2009年40纳米的GPU产品,一直到2016年14纳米的GPU产品,一共8代16颗的GPU产品都是出自于沐曦核心研发团队之手;从GPGPU产品方向,从2017年的第一代7纳米MI60产品,到第四代当前最新的、已经应用在美国超算的GPGPU产品,也都是由我们团队成员打造而成。有这样一个强大的团队核心,虽然公司成立时间不长,但是已经带领团队显示出了强大的战斗力。
沐曦的产品技术研发已取得突破性进展。第一颗高性能通用GPU芯片主要面向AI推理,在今年年初成功流片,这颗芯片从立项到流片仅仅用了13个月的时间。沐曦将在今年和明年分别推出针对AI推理和训练的高性能面向异构计算的通用GPU芯片;同时高性能渲染GPU芯片也正在路上,敬请期待。
仅仅有GPU的硬件是不够的,因为硬件是基础,软件才是整个应用系统的灵魂。
面向整个GPU应用平台,包括生态打造上,沐曦有非常强大的软件和应用研发实现团队,打造可以兼容当前主流GPU的软件和生态。相信在未来的软件应用,包括生态打造中,沐曦可以给大家提供一个非常强大的利器,能够快速地把自己的新算法新需求,在我们的运算平台上进行快速导入,实现算力需求的快速实现。
未来的挑战
当然,对GPU而言,这么复杂的芯片在研发和实践过程中,其实还有很大的挑战。
首先,GPU在中国是一个新兴事物,人才方面非常短缺,而且人才培养是需要时间的,比如GPU工程师、设计师、软件驱动等人才,需要有足够的时间,才能培养出来成熟的工程师,才能满足我们的研发需求。
另外,GPU的研发其实是一个非常高技术壁垒的研发领域。当前世界上GPU的供应商,包括英伟达、AMD、英特尔,他们都已经有数十年的经验和技术积累。但在国内,整个GPU的研发投入时间相对来说还是比较短,所以我们面临了很高的技术壁垒。
在GPU领域,以英伟达为首的巨头已经建立了成熟的应用生态,这种操作方式在各个应用领域已经深入人心,当前的AI工程师已经习惯采用了他们的这种研发模式,未来的开发者进行迁移,难度是非常大的。
目前的策略就是从兼容CUDA生态切入,占据一席之地,然后再逐步去构建自有的生态体系。相信我们未来一定会做得更好。