12月8日,在“2023粤港澳大湾区硬科技产业资本高峰论坛”上,遇贤微电子董事长创始人罗勇发表题为“CPU产业与指令集架构的发展与展望”的主题演讲。
罗勇认为,在摩尔定律开始减缓的前提下,大家必须坐下来深入的思考在微架构、功耗管理以及系统组件上,如何能统一给客户提供性能更新进,更好能效的产品。
而计算机产业多年发展以来形成了两大体系,一是PC端的Wintel体系,二是手机端的Arm+安卓体系,这两个市场目前竞争非常激烈,另外一大市场就是云计算。
云计算市场同时具有存量规模大、增量高的特点,只有这两个条件同时满足,遇贤微电子这种做新兴服务器CPU和芯片的公司才有机会。
以下为现场演讲实录,由投中网进行整理:
我自己大概有20多年CPU经历,从20多年前到现在的X86整个的周期,所以跟大家分享一下CPU产业的指令集发展它的历史、变迁,以及将来的展望。
首先整个数字产业它是一个非常群体化的垂直生态,大家可以看到这里面有很多很熟悉的名字,从底下,我们当然中国现在最被“卡脖子”的是晶圆代工生产这条线,其次上面一层是处理器,无疑是我的老东家英特尔目前还是最大的,但是实际上当年20多年前他不是,他实际上是从当年的那些小型机,然后再到新兴Arm等等这些。
这里面可以看到这个产业的垂直分工,其实每一个层级都是万亿千亿级的产业,这里面有很多熟悉的名字和符号,比如说苹果从处理器到操作系统、到垂直系统,每一个行业都有它,还有我们的那朵花,它也是在每一个层面,甚至到将来最底下那个层面都有它的身影。这些是大家比较熟悉的。遇贤微就是在中间处理器这个行业,就是对标英特尔、AMD、三星这种专门做处理器设计的。
首先回顾一下中央处理器CPU,从当年的PC、小型机到手机,到现在云的服务器,甚至物联网终端里所有的中央处理器,这是必不可少的。它主要的决定性能因素是什么呢?其实整个半导体产业所有的芯片都是吃了这些年最近这20多年摩尔定律的红利,主要来自于工艺、制造、流程的更新。
真正是需要大家在这个产业坐下来仔细深耕发展的,实际上是上边这几个微架构、功耗管理,这一系列需要电子工程、计算机架构的人去深耕,但是用摩尔定律来的太自然了、太快了,40%的东西都是可以直接下一代,两年以后就可以翻上去,所以为什么计算机架构的几个大宗师,这些人讲现在的架构的书跟90年代的书没啥区别。
现在摩尔定律开始减缓,大家必须坐下来深入的思考,我们在架构上面、功耗管理上,这些系统组件上怎样能够统一给客户提供更先进的性能,更好的能效,是必须在突破的。
比如说像现在的小芯片、芯片的互联技术,所有的这些微架构,其实跟用什么指令集,是否走RISC没有什么关系,所有的计算机的不管是CPU、GPU,每个层面都是必须努力去研发的。
计算机产业发展这么多年,基本上有两大体系,就是PC端的Wintel体系,手机端的Arm+安卓体系。这两大体系其实发展至今都有自己的非常高的护城河和门槛,主要是生态,主要是因为整个的软件生态是群体效应,取决于从操作系统到上面的业务应用,整体决定了它的护城河。
首先从英特尔来讲,其实我在创立遇贤微电子之前是在上海,是新创国家队里面做X86的,它其实也是完全兼容Windows,就是因为Windows在PC端它的生态极其强大,目前为止它只支持4个CPU,就是英特尔、IMD和卫生再加上高通,当年明年微软会把Windows开放给整个Arm的行业,有很多新兴的Arm CPU会跑在Windows上面。
到目前为止不管是微软还是华为的系统,其实它的Arm版本都必须用高通的芯片,这是它一个非常强大的生态,因为它40年积累下来的整个软件生态是别人很难侵入进去。
反过来因为智能手机的崛起,特别是iPhone跟安卓的崛起,整个领域就是一直是Arm,英特尔跟微软,他们俩的资金、技术、资源可以说是无与伦比的,但是他们经过很多年的,大概投入上百亿的资金,仍然没有办法突破手机端和平板端,就是安卓和Arm的生态,所以它是整个一个产业群体造成的。
那么在云上面就有点不同。全世界除了微软云的一部分是用Windows Server,其他的云基本上全部是Linux,这是一个开源的生态。而且云还有一个特色,现在云显然是一个比PC和手机成长更快。任何一个有大增量的市场就给新兴势力机会。
所以说云上为什么首先Arm在PC上无法大规模的突破之下,当然明年的Arm和Windows开放之后是另外一个东西,但是现在在云上面,基于多核、能效、云原生的特点,X86跟Arm已经进入一个比拼的阶段。
最近亚马逊公布的数据,它已经有200万颗自研的Arm芯片,上面部署了5万多个客户在使用,亚马逊的客户也是非常巨大的,像美国著名的软件服务商,SAP等等这些全部是在亚马逊上面跑。
还有一个新兴的领域RISC 5,但是还是一个生态的问题,大家没有看到RISR 5的手机,没有看到RISC 5 PC,RISC 5的服务器开始有一些,但是也是在一些生态还没有完全成型的领域,比物联网终端、可穿戴终端、硬盘的控制器,这些领域开始崛起。指令集本身其实不是最重要的因素,因为它是非常群体的产业效应,它主要是看生态才能决定这个指令集是胜出还会逐渐被取代,历史已经证明了这一点。
什么叫CPU的指令集,CPU目前为止所有的CPU还是原来的架构,基本上就是这几大块,包括存算一体、Reduced等,只是说把内存跟计算更接近、放在一起了,减小延迟,所以指令集本身并不是说到底复杂指令到还是简化指令好,这两个殊途同归,基本上已经朝一个方向在走了,复杂指令在简化,简化指令在复杂。就是这么回事。
所以现在世界上可能最大的垄断就是复杂指令,就是X86,RISC,其实历史是非常长的,在20多年前,我的早期职业生涯,实际上是经历了这些,比方说最早提出RISC的两个大师,他们当年创立了一家非常高效,非常火的一家RISC的CPU公司,后来卖给SGI。
当年这些系统大厂,刚才讲的产业分工的图,当年在美国就有很多系统大厂是垂直整合的,除了生产之外他们几乎全部都做,比如说IBM的PC等等,每一家都是二三十年前响当当的系统大厂,但是现在也就只剩下IBM一家了,而且他已经慢慢的淡出视野,其他SGI早就不做了。
所以经过历史的演变,他们实际上是被X86的给取代了,现在新兴崛起的有一家叫Arm的公司,手机、平板、移动终端和新兴的服务器,还有一个最新兴的就是RISC 5,所谓的指令集、指令架构、汇编语言,再加上它里面一些计算器,至于性能,40%是由工艺流程来决定的。
除了工艺之外,影响性能的很大一部分原因是微架构,而这个恰恰是我们自己最缺的。大家可以看到这个图是Arm精简指令的,它们的架构已经很复杂了,X86S把它简化了,而Arm作为一个指令集,V9已经近千条指令了,它们两个慢慢已经接近了,它的基础指令只有几十条,现在真正在实现RISC5的已经有把它扩展到很多了,所以两个其实走的路线是一样的。真正决定性能的,工艺占40%,生态决定你的胜出。
这两个最大的区别就是现在商务模式,X86没有授权的模式,它只允许英特尔,为什么叫X86,因为从8086、186、286、386、486这么上来的,AMD是当年做PC的时候,IBM强制英特尔开源给AMD,必须有第二家供应商,威盛当年有一些专利官司,给英特尔一个交叉授权。
那么在中国有两家国产CPU公司,一个叫海光,是跟AMD合资的,上海兆鑫(音)是跟威盛合资的。但是Arm的商务模式就不同了,它通过授权IP,本身是不做芯片的,所以Arm就有很多人来做。RISC5更不同,它的指令就是开放的,它的授权其实跟Arm也是一样的。这就是我自己经历的从80年代中期到2000年,英特尔的PC崛起,从PC端席卷到后端服务器端,一直到现在形成了云。
同样,智能手机的崛起、移动互联网的崛起,让Arm从移动终端突破到服务器端、云端,这是我20年看到的产业周期。
最近10年来,从华为海思、中星微电子,一直到现在遇贤微电子,我们160核的最高性能服务器芯片的演进过程。目前遇贤微电子针对中国的云计算市场做的,在当前来看仍然处在世界一梯队的性能。现在都在讲算力经济、算力中心、智算中心,最大的错误理解是这里面就是AI芯片、GPU,好像没有别人啥事儿了。
但CPU是必不可少的,就连微软ChatGPT、OpenAI的服务器大概有1万台,它配GPU就是著名现在当红的“炸子鸡”最热的A100、H100是配1到8颗,其实CPU、GPU的比例是2:1或者是2:8,因为你无法想象一台电脑也好,服务器、手机,只有GPU,只能做图不能做其他的事情,只能做AI,不能做其他的事情,这是不可能的,CPU是必须有的。
一台服务器或者是电脑的基本配置,大概三分之一是CPU的,还有就是内存、硬盘或者是固态盘,形成一个整机系统,从芯片厂到整机厂,加上软件操作系统,才最后交给下一个客户——全球的云计算,如亚马逊、微软、谷歌,中国有中国电信、腾讯云、阿里云、移动云等一系列的云厂,还有很多企业的客户,金融客户、政府客户等,所以我们既要跟中间的这些整机厂紧密合作,只有通过他们,芯片才能够送到最终的用户手里,同时要跟各种操作系统进行适配,才能交到最终用户。
回过头来,这里面有两个决定因素使这个子赛道非常火爆:第一,云计算是一个存量非常大的市场,第二,增量也巨大。只有这两个条件同时满足,像遇贤微电子这种做新兴服务器CPU和芯片的公司才有机会,因为如果一个市场很小,那就是一个完全的红海市场,如果一个市场不成长,你要去搞存量。
所以同时具有存量规模和高增量的大市场就是云计算,这就是遇贤微电子目前对标的市场。
好,谢谢大家!