芯片,过往认为是电子设备中最复杂的元件。随着科技的日新月异,定制化芯片的需求越来越高,这也导致了许多大企业纷纷自研自己的芯片,除了能够降低成本之外,也能够最大化性能。这些公司当中包括了谷歌、亚马逊、苹果以及特斯拉等。
谷歌
2021年8月5日,谷歌 在推特上公布了关于其新一代 Pixel 手机的信息,并首次放出了关于首代 谷歌自研芯片——Tensor 芯片的很多资料。
谷歌Pixel系列手机
谷歌CEO Sundar Pichai将 Tensor 芯片称为迄今为止在 Pixel 领域最大的创新。谷歌将Tensor 芯片对标其对手苹果旗下的A系列芯片。
谷歌认为,如今安卓手机已经跨过了手机综合性能不足的门槛,下一代手机需要的并非更强的性能、更大的运存,想要继续改善如今智能手机的使用体验,则需要借助各种深度学习技术、针对使用场景优化的协处理器来完成。
谷歌为手机设计芯片,开始让安卓阵营手机芯片的巨头捏了一把冷汗,股价在谷歌发布Tensor 芯片后应声下跌,例如高通。
高通股价在Tensor芯片发布后下跌
谷歌将过往发布的各种协处理器全部整合进Tensor 芯片。在谷歌的计划里,自研芯片其中一个重要目的就是进一步推动谷歌旗下各种 人工智能、机器学习技术,借助算力更强大的移动端硬件优化普通用户的实际使用,进一步推动 AI 的实用化。
相比于其他芯片,Tensor 芯片最大的区别在于加入了谷歌针对移动设备定制的 TPU 处理单元。张量处理单元(Tensor Processing Unit,TPU),是谷歌开发的专用集成电路(ASIC),专门用于加速机器学习。比如,谷歌 Tensor 芯片的性能比高通的骁龙 888+ 强一些,虽然功耗高,但是其AI 性能3 倍于 888+。
手机摄影涉及了机器学习,例如在黑暗的情况里,手机利用机器学习来自动调色,不会让我们拍照“黑黑一片”,提高照片的质量。根据谷歌的介绍,Tensor 芯片将进一步加强Pixel系列手机的拍照功能。
过往许多安卓手机有着一些缺点,例如在拍照处理照片的过程中其他在后台运行的应用进程被“杀掉”或是感受到明显卡顿。而随着Tensor 芯片的加入,谷歌称 Pixel 6 将会给手机摄影领域带来全新体验。谷歌进一步表示,Pixel 手机未来借助更强算力能拓展的更多使用场景,比如把因为快速移动导致模糊的人像照片“抢救”回来,以及让视频在不同的光线环境下保持最自然的白平衡等。
谷歌 Silicon 团队高级主管Monika Gupta表示:“对于谷歌来说,我们希望把 AI 运用在生活的方方面面,甚至园区餐厅的菜单也可能是由 AI 根据我们的喜好来设计。我们不想生产传统意义上的智能手机,谷歌想要 AI 和机器学习处理能力大增的设备,但市面上的处理器并不满足谷歌的需求,更强的AI 是谷歌选择自研芯片的初衷。”
The Verge实测Pixel 6以及 iPhone 12 Pro Max拍照性能对比认为,Pixel 6没有太多过度锐化痕迹。可以说谷歌正在依靠着Tensor 芯片追赶者苹果。
亚马逊
亚马逊除了是一家电商巨头之外,也是云计算领域的巨头(AWS)。亚马逊正在积极自研云计算芯片。2021年12月21日,亚马逊云发布了通用服务器芯片Graviton 3、机器学习云端芯片Trainium以及固态硬盘,并提供相关云计算应用。实际上,亚马逊早在2015年就收购了以色列芯片公司Annapurna Labs,布局自研芯片。
Graviton 芯片主要应用在服务器、云服务、高性能计算、机器学习等领域。许多 AWS 服务,包括 Amazon Aurora、Amazon ElastiCache、Amazon EMR、AWS Lambda 和 AWS Fargate,都使用Graviton 芯片。而许多企业包括Epic Games、DIRECTV、Intuit、Lyft 和 Formula 1 等都有采用亚马逊的Graviton 芯片来进行计算。
通用服务器芯片Graviton 3,采用Arm架构。Graviton3的计算性能是 Graviton2是 1.25倍,如果特别专注在科学领域(尤其是机器学习)、加密领域等使用浮点运算的话,Graviton 3性能最快可达2倍。Graviton 3采用5纳米制程。
Graviton第一代处理器发布于2018年11月,定位为云原生芯片,对云端基础架构进行了针对性优化。Graviton处理器的推广也帮助Arm架构蚕食英特尔处理器的市场份额。虽然Arm架构在智能手机市场呼风唤雨,但服务器领域则是英特尔的天下。2021年9月10日,IDC发布的《全球服务器季度跟踪报告》显示,x86服务器产生的收入在2021年第二季度增长2.2%,达到214亿美元,占全球服务器收入的90.3%,x86服务器市场芯片基本为英特尔所有。
Trainium 芯片是亚马逊AWS 设计的第二款定制机器学习训练芯片,可为在云中训练深度学习模型提供最佳性价比。 Trainium 芯片专门针对图像分类、语义搜索、翻译、语音识别、自然语言处理和推荐引擎等应用程序的深度学习训练工作负载进行了优化。而随着机器学习使用的加速,迫切需要提高性能并降低推理和训练驱动的基础设施成本。 AWS 推出了 Inferentia芯片,这种定制芯片可以在云中以最低的成本为客户提供高性能的机器学习推理。
亚马逊表示,借助 Trainium 和 Inferentia,客户可以获得最佳的机器学习性价比,从扩展训练工作负载到通过高性能推理加速生产中的深度学习工作负载,让所有客户都可以使用机器学习的全部功能。
云化是企业接下来将要面对的一个大趋势。许多企业不是已经云化,就是在云化的路上。企业对于云计算的需求也会持续增加。定制化,专门为云计算服务的芯片自然也就会有相应的需求。亚马逊积极布局相关芯片的设计也是看好未来云计算在此方面的发展。
苹果
2020 年 11 月 11 日,苹果通过线上发布会正式发布全新搭载自研 M1 芯片以及搭载 M1 新品的三款 Mac 产品。M1 芯片主要专为Mac打造,采用 5nm 工艺制造,集成多达 160 亿个晶体管,而且是一颗完整的 SoC,集成所有相关模块,并采用苹果自创的封装方式。
根据苹果的资料显示,M1 可以在 10W 功耗下提供两倍于如今市场上最新笔记本芯片的性能,能效比则高达三倍。而搭载了M1 芯片的Mac电脑能够实现最高 3.5 倍的 CPU 提速,最高提 5 倍的 GPU 提速和最高 9 倍的机器学习提升。与此同时,其续航比上代也有着大幅提升。
纵观苹果的产品发展史,苹果一直坚持的产品战略都是软硬一体,除了对于供应链有很高的要求之外,苹果也希望产品所有的零件都是自己设计,这样一来就不会有零部件被其他公司卡脖子的问题。英特尔此前的“挤牙膏”行为引起了苹果的不满,除了硬件跟不上软件之外,苹果也无法定制化笔记本电脑,让自身产品性能达到极致。因此研发了M1芯片以摆脱英特尔在笔记本电脑处理器的卡脖子。
苹果自研出M1芯片除了可在笔记本电脑领域拥有更多话语权之外,苹果旗下的Mac 的使用体验将和 iPhone、iPad 更加协同,因为所有的苹果应用都采用 ARM 架构,而 iPhone 的应用将能够与 Mac 兼容。苹果自身也能够根据产品迭代周期来持续更新芯片技术,不必跟随英特尔的脚步。而对于用户来说,除了体验的升级之外,Mac 系列产品将比以往的售价要低许多,因芯片处理器由苹果自家研发。
根据苹果官方的资料,M1芯片的性能超过英特尔过往的芯片处理器,且性能增加了但能耗没有增加。苹果硬件技术高级副总裁Johny Srouji表示,这是苹果制造过的最强大的芯片。与最新的8核PC笔记本电脑芯片相比,M1 Pro在同等功耗水平下的中央处理器性能可高达1.7倍,达到其峰值水平性能的功耗则少了70%。
M1芯片与其他芯片的性能对比
来源:苹果官网
特斯拉
2021年8月19日,特斯拉在帕罗奥图总部召开AI日,这是特斯拉的第三场技术发布会。在过去两场技术发布会上,特斯拉发布了包括首枚车企自主研发自动驾驶芯片FSD 芯片、算力达到144 TOPS的Autopilot HW 3.0、无极耳电池、大体积自研电池、无钴电池等。
在此次技术发布会上,特斯拉发布了自研的D1芯片、特斯拉Bot机器人、全新自动驾驶模拟程序等多项与人工智能相关的新技术。
此前在2021年6月19日举办的CVPR 2021(人工智能学术顶级会议)现场,特斯拉展示过名为Dojo的超级计算机的相关性能。根据当时披露,Dojo采用5760个英伟达的A100 GPU,总算力达1.8EFLOPS,读写速度高达1.6TBps,被认为会超越全球排名第一的超级计算机富岳。
世界超级计算机排名
来源:Top 500网站
值得注意的是,特斯拉在AI日进一步宣布Dojo将采用特斯拉自研训练CPU—— D1芯片。特斯拉Autopilot(特斯拉自动驾驶程序)的工程主管Milan Kovac上台展示了D1芯片。
D1芯片基于7nm工艺,包括500亿个晶体管数量,内建354个训练节点,仅内部的电路就长达17.7公里,算力高达362TFLOPs,功耗仅400W。Milan Kovac表示,这可能是市面上最强的芯片,Dojo未来一段时间仅专注于训练特斯拉的自动驾驶汽车程序。
此外,D1芯片未来会成为Autopilot 3.0版硬件基础,目前特斯拉车型上搭载的是Autopilot 2.5版硬件。全新硬件系统将实现大幅性能提升,为日后特斯拉车型升级更高阶的自动驾驶系统提供了足够强大的计算能力保障。
根据特斯拉的描述,D1芯片主要作用是处理来自摄像头、超声波传感器以及雷达的数据,经过数据分析最终给出车辆控制决策。其中,处理来自摄像头的图像数据消耗计算能力最多。如今特斯拉的自动驾驶系统/方案是一种较为依赖摄像头数据的系统,所以提升芯片计算能力对于提升特斯拉自动驾驶系统的性能是至关重要的。
Dojo D1芯片则有望进一步加速特斯拉自动驾驶系统的发展。在AI日上,特斯拉继续传达其视觉系自动驾驶技术路线的决心。Autopilot软件主管Ashok Elluswamy在发布会上表示,特斯拉自动标记技术,强调道路上有太多物体需要标记,利用标记的物体来重现道路上的场景。而这背后则是需要庞大的算力。D1芯片将会帮助特斯拉持续推进其视觉方案的落地以及成熟化。
END.
(李显杰 )