英伟达马不停蹄奔跑了30年
编者按:本文来自微信公众号秦朔朋友圈(ID:qspyq2015),作者:悟00000空,创业邦经授权发布。
2013年至2023年这十年,英伟达的市值翻了115倍,是美国股市回报率最高的公司。
黄仁勋出生于中国台湾,四岁随父母移民美国。1984年大学毕业,获得俄勒冈州立大学和斯坦福大学工程学位。1993年,他与两位朋友共同创办了英伟达,总部设在美国加利福尼亚州圣克拉拉市。
早期英伟达的产品是GPU(Graphic Processing Units图形处理器),俗称显卡,主要用于游戏。英伟达在3D游戏领域取得突破性进展,成为GPU行业的领头羊。
到2021年为止,能够量产GPU的公司只有英伟达、AMD和英特尔。英特尔以集成GPU为主,AMD两者都有,而英伟达则提供独立GPU,在独立GPU市场,英伟达占80%多的市场份额。
不过相对于CPU(Central Processing Unit中央处理器),GPU的市场小得多。芯片行业的老大是主要生产CPU的英特尔和AMD。2000年,英特尔的市值是2770亿美元,世界排名第六,是英伟达的60倍,如今是英伟达的七分之一。
CPU和GPU的区别主要是,CPU擅长逻辑控制的串行计算,GPU则擅长大规模的并行计算。
经常打的一个比方是,CPU好比学识渊博的教授,而GPU好比一群小学生。即使教授再神通广大,也不能一秒钟内做500次加减法,而500个小学生同时做就能做到。所以,重复的简单计算适合用GPU。而图形的识别,就是对每个像素进行同样的简单计算,显然用一群小学生同时计算比用一个教授一个个像素计算效率要高得多。
因此,GPU特别适用于图形图像计算、天气预报、神经网络AI模型以及虚拟货币挖矿等。
2010年,谷歌负责人工智能的吴恩达为了训练神经网络来识别猫,最初使用了16000台计算机的CPU完成了训练,耗费巨大。随后他与英伟达探讨了这件事情,英伟达仅采用了12个GPU就完成了训练。
黄仁勋敏锐地意识到机会来了,GPU不再只是游戏的显卡,它在AI领域有着得天独厚的优势,随着AI的发展,GPU的需求将与日俱增,而CPU将成为配角。英伟达赶超英特尔和AMD,在此一搏。
当时,适逢投资周期低谷,热过一阵的AI已经被很多人遗忘,就是业内人士所谓的“AI寒冬”,研究开发人员哀叹他们将永远无法获得足够的算力实现自己的梦想。而黄仁勋则逆势投资,摩拳擦掌,大举切入数据中心市场。
英特尔和AMD还浑然不觉芯片行业将发生地动山摇的变化。每次新技术的问世普及,都是行业洗牌的大好时机,英雄还是狗熊,立见分晓。
2017年黄仁勋宣布将英伟达的未来押注在AI上。彼时,OpenAI才刚刚成立不到两年,ChapGPT的研究还在起步阶段。
2021年第二季度,英伟达的数据中心业务销售收入首次超过它原来的主业游戏。
此外,早在2008年,英伟达就开始布局自动驾驶平台化芯片,抢占智能汽车市场份额。同时,英伟达元宇宙(Nvidia Omniverse)制定通用标准,打通不同设计平台,已成为元宇宙平台级应用。
黄仁勋的梦想不仅仅是摆脱游戏公司的定位,成为AI浪潮中的“卖铲人”,他更希望成为AI浪潮的推动者、加速者。这些年,黄仁勋一再表示:“英伟达不是游戏公司,它将推动下一个AI大爆炸。”
一开始很多人认为他想多了,一个卖游戏显卡的公司是不是高估了自己?
去年11月ChapGPT横空出世,举世瞩目,大家忽然都明白了,AI时代已经来临。AI是继个人电脑、英特网、移动电话、云之后又一个革命性的技术,而且影响将更深远。
英伟达是这AI大浪潮中获益最多的公司。2023年年初至今,它的股价已经翻了近两倍。
正如芒格所说:“永远不要低估一个高估他自己的人,因为他很可能是对的。”虽然最近他说的是马斯克,然而对黄仁勋也同样适用。
推出全套产品与服务,锁定客户,打造进入壁垒
客户使用GPU,需要和CPU配套,而CPU的龙头老大是英特尔,老二是AMD。黄仁勋决定自研CPU,为客户提供全套服务。
2021年英伟达推出自己的CPU Grace系列产品,以Grace Hopper(格蕾丝·赫柏)命名。Grace是一位传奇女性,她是耶鲁大学第一位女博士,杰出的计算机科学家,同时也是美国海军将军。她发明了世界上第一个编译器,开发了第一套完整的程序语言COBOL。美国海军“赫柏号”驱逐舰就是以她命名的。
CPU Grace基于软银集团旗下的芯片设计公司ARM的架构。ARM是移动设备的首选架构,市场占有率超过90%,被誉为“移动互联网时代的明星”。
很多年前,黄仁勋就和软银接洽,希望收购ARM。2020年9月,软银宣布同意以高达400亿美元的价格将ARM出售给英伟达。但是后来因各国监管部门的反对没有成交。今年年初,英伟达不得不宣布收购计划最终失败,取而代之的是以12.5亿美元获得20年使用权的新交易。
不过其它公司的收购相对顺利得多。2019年,英伟达以69亿美元收购了Mellanox公司,获得了InfiniBand技术,使网络交换速度得到保证。同时获得了Bluefield芯片,英伟达将其称为DPU(Data Processing Unit),承担原先需要CPU来执行的网络数据处理、分发的重任,有效降低云计算的性能损失,释放CPU算力,降低功耗的同时,大大降低云数据中心的运营成本。
至此,英伟达的CPU+GPU+DPU产品矩阵全面形成,为客户提供一站式服务,进一步将英特尔和AMD挡在AI浪潮之外,也威慑了潜在进入者。有了这个产品矩阵,英伟达就可以重塑数据中心的底层硬件市场,进一步打造这个市场的进入壁垒,获取优势地位。
帮助英伟达打造市场进入壁垒的另一个利器是于2016年推出的CUDA(Computer Unified Device Architecture),一种通用并行计算平台和编程模型,以比CPU更有效的方式解决许多复杂的计算问题。打破了自60年前IBM System360以来CPU运算模型一统天下的局面,实现了加速计算。
在CUDA问世之前,想要调用GPU的计算能力,必须编写大量的底层语言代码,而CUDA使得GPU成为通用GPU(General Purpose GPU),大大提高了效率。即便竞争对手的GPU在硬件参数上比肩英伟达的GPU,但缺少CUDA的优化,其计算效率还是无法达到英伟达GPU的水平。
早在2006年黄仁勋就大力支持CUDA系统在AI领域的开发与推广,每年投入的研发经费高达5亿美元,而当时年营业额只有30亿美元,市值不过10亿美元。股价多年表现低迷,股东对CUDA持怀疑态度,希望英伟达更多地关注盈利。
但是黄仁勋高瞻远瞩,不追求短期利益,坚持开发CUDA,并不断更新、优化,最终形成独特的生态系统,让英伟达抓住了人工智能AI的机会。目前,CUDA服务于400万开发者和逾3000个应用程序,下载量达到4000万次,其中仅去年一年就达到了2500万次。
CUDA的定价策略很能反映黄仁勋的战略思维。当时他让美国大学及科研机构免费使用CUDA系统,使英伟达迅速占领了AI市场。等到收费的时候,用户的转换成本已经十分高昂。再说这个收费标准也是相当有良心,没有转换的必要。
这令人想起微软视窗Office软件在中国的定价策略。微软Office软件进入中国市场是在1995年左右,当时对于微软来说也是免费,因为几乎全是盗版,它收不到钱。但是微软从来没有采取任何实质性措施打击盗版。
虽然比尔·盖茨每次访华都会提一提知识产权保护的问题,不过他显然无意真正打击微软的盗版,因为这其实在技术上很容易做到,但他却没有做。据说比尔·盖茨有一次说漏了嘴:“至少他们盗版的是我们微软的软件。”假设当年中国人盗版的是苹果的软件,微软肯定不答应。微软的盗版软件是它对付苹果的“斗士品牌”,更是它对付当时的市场霸主金山WPS的“斗士”。
如今,微软的软件牢牢占据了市场,这种网络效应很强的产品一旦占据市场,就很难被铲除。这时候微软开始收费,个人用户每年398元人民币。如果当年一开始微软就打击盗版,对正版每年收费398元,甚至哪怕39.8元,估计它都很难占领中国市场,人们很可能还在用WPS。
微软一直是一家很有战略思维的企业,从它起家时和苹果的博弈、在中国占领办公软件这些事情上就可见一斑。
现在看起来,英伟达也是一家很有战略思维的企业,从CUDA的定价策略中就可见一斑。不仅如此,黄仁勋的几乎每一个决策,都体现出他高超的战略思维能力。
除了押注人工智能、推出全套产品、博弈性定价外,英伟达还做了一个很英明的战略决策,那就是只设计芯片,而不制造芯片,将芯片制造外包给代工厂——台积电。
而英特尔却选择了相反的做法,现在举步维艰。在半导体行业,英特尔是一个时代的象征,曾经辉煌夺目。著名的摩尔定律就是它的三个创始人之一、第二任CEO戈登·摩尔提出的。上个世纪80年代初,创始人之一、第三任CEO安迪·格鲁夫与比尔·盖茨结盟,40年后的今天Wintel继续占领着个人电脑市场。
不过,现在手机的使用大大超过了电脑。但是当年英特尔并没有看到手机的前景。苹果最初希望使用英特尔芯片为iPhone提供算力。英特尔当时的首席执行官保罗·欧德宁拒绝了乔布斯,担心其手机项目不能取得足够的成功以回报英特尔的投资。等到苹果手机如日中天时,英特尔再去找苹果,被苹果拒绝了。
近十多年来,苹果对定制芯片的持续投资不仅阻止了英特尔在移动领域有任何作为,还帮助苹果建立了必不可少的软件平台。尽管大多数科技媒体都预测安卓(Android)将成为具有类似微软对消费科技行业控制权的“新Windows”,但这并没有发生。苹果扮演了这个角色。
安卓则扮演了苹果的盗版“斗士品牌”角色:一个有力的竞争对手且有效地阻止了其他任何真正的竞争者,讽刺的是,这其中也包括微软。
6月6日,苹果公司在其开发者大会WWDC上宣布,即将上市的Mac Pro电脑将采用全新自研芯片,自研芯片进入整个PC产品线。也就是说,连电脑都不用英特尔了。
英特尔错过了移动通信的浪潮,现在又错过了人工智能AI的浪潮,而它坚持的设计与生产一体化的集成模式又被证明不值得坚持。
到了21世纪第二个十年,包括英特尔的主要竞争对手AMD在内的大多数美国大型逻辑芯片公司都出售了自己的晶圆厂,只专注于设计。英特尔却固执地坚守集成模式,认为设计和制造流程可以相互优化,是生产芯片的最佳方式。
这是有一定道理的。但是不设计只制造芯片的台积电,可以为不同的公司制造芯片,现在每年制造的硅片数量几乎是英特尔的三倍,所以它有更多的时间打磨工艺,生产经验更丰富,学习曲线更陡直。
此外,台积电自己不设计芯片,所以所有的芯片设计公司都是它的潜在客户。而英特尔则把其中不少公司视作潜在竞争对手,那些公司也不放心让英特尔代工。
根本的利益冲突决定了英特尔的代工业务肯定做不起来,但是英特尔的领导不这么想。2013~2018年担任英特尔首席执行官的布莱恩·克扎尼奇曾公开表示:“过去几年,我基本上一直在运营我们的代工业务。”并称这项工作“具有战略重要性”。然而,到21世纪第二个十年他只赢得了一个主要客户。不久该业务就关闭了。
英伟达则完全没有犯这个错,从一开始就只专注于芯片设计,把制造外包给台积电。25年前,黄仁勋在中国台湾与台积电创始人张忠谋会面,开启了英伟达与台积电持续深厚的合作。
除了押注人工智能、推出全套产品、博弈性定价、专注于设计,黄仁勋还做了一个很艰难的决策,就是放弃庞大的手机市场,而专注于使命和愿景,即“创造出能解决普通电脑解决的问题的电脑”,最终创造了一个新的技术,即拥有神经网络处理器和AI算法的安全架构的机器人技术,开创了一个全新的行业。
战略就是取舍,知进退。而放弃、撤退往往比争取、进攻需要更大的智慧和勇气。
5月29日,在COMPUTEX大会上,黄仁勋正式向传统CPU服务器集群发起“挑战”,他直言,随着需要大量计算能力的AI应用出现,GPU将成为主角。
黄仁勋还展示了一个范例,训练一个大语言模型(LLM),需要960个CPU组成的服务器集群,这将耗费大约1000万美元和11千兆瓦时的电力。而同样以1000万美元的成本去组建GPU服务器集群,将以仅3.2兆千瓦时的电力消耗训练44个大语言模型。
训练一个LLM,GPU只需40万美元左右,消耗0.13千兆瓦时电力。也就是说,相比CPU,GPU能够以4%的成本和1.2%的电力消耗来训练一个LLM。
5月27日,黄仁勋受邀参加中国台湾大学毕业典礼,做演讲。他首先回顾了40年来的技术发展,预测了未来的趋势,认为2023年和1984年(他自己毕业的那一年)一样,是“一个完美的毕业年份”。
接着他讲了英伟达从失败中涅槃的三个故事,勉励台大毕业生们要学会承认错误,寻求帮助;学会承受痛苦,坚持梦想;学会“撤退放弃”,聚焦战略核心,而不是急功近利。
最后他说:“无论是什么,像我们一样全力以赴去追求它,跑吧!不要慢慢走。也许你在为了食物而奔跑,也许你在为了不被他人当食物而奔跑,你往往无法知道自己正处在哪一种情况,不论怎样,都要保持奔跑!”
英伟达马不停蹄奔跑了30年,跑着跑着就超过了所有竞争对手,跑到了食物链的顶端。
继续奔跑吧,英伟达!
作者:曾在复旦学习、任教9年;曾在中欧国际工商学院供职20年
本文(含图片)为合作媒体授权创业邦转载,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。