今年年初,大多数人从未听说过生成式人工智能,现在全世界都在竞相利用它,而这仅仅是开始。空间计算、量子计算、6G、智能基础设施、可持续发展等新市场正在加速更快、更高效、更专业地处理更多数据的需求。
与每隔几年等待下一个流程节点的日子相比,过去一年和未来几年发生的事件将与电话或汽车的诞生一样重要。但创新技术会有很多,它们的交叉方式将继续给科技界带来惊喜。
我们正在进入一个定制硬件、异构集成、软件定义系统的时代,而所有这些都依赖于半导体。但即使是芯片也在发生变化。它们变得更有针对性、更加复杂,而且潜在的安全威胁也更大。所有这些趋势将迫使设计师重新思考工作流程、架构和商业模式,其中一些在
2023 年变得明显,但将在 2024 年开始真正加速。
AI/ML
2023人工智能/机器学习(AI/ML) 随着 Google Gemini AI 的发布而落下帷幕,它既是对 ChatGPT 的追赶,也是对多模式 AI
的突破性推动。谷歌的新技术应该会带来更多的设计进步,因为其他公司也在寻求将图像和视频纳入他们的生成人工智能工作中。
Quadric首席营销官 Steve Roddy 表示:“Gemini 之所以引人注目,有几个原因。” “首先,它有多种版本,可以从数据中心(Gemini
Ultra)一直扩展到内存受限的电池供电设备(参数为 1.8B 的 Gemini Nano)。其次,谷歌提供了 Gemini
的预量化版本,可以在边缘设备中部署。谷歌并没有强迫嵌入式设备开发人员进行浮点到整数的转换,而是小心翼翼地使其部署就绪,因此不需要用户扮演数据科学家来进行转换。对于边缘设备和手机开发人员来说,Gemini
Nano 的部署比许多以前的 GenAI 模型要简单得多,这可能会刺激应用程序中更广泛的采用和集成。”
与其他超大规模企业一样,谷歌也拥有定制的人工智能生态系统,随着跨多个领域的更多公司开发自己的人工智能芯片,这一趋势预计将加速。
Alphawave Semi首席技术官托尼·陈·卡鲁松 (Tony Chan Carusone)
表示:“我们将看到大型、令人兴奋的新应用和突破来自于开发自己的定制人工智能芯片的公司。”
“有各种各样的案例可以激励人们。例如,甚至像特斯拉这样的公司也在开发自己的定制人工智能芯片,以帮助实现自动驾驶训练。未来五年,最令人兴奋的突破和应用将来自在这种定制硬件上运行的人们。”
Vikram
指出,事实上,除了通常的大公司组合之外,许多初创企业正在利用云技术来构建人工智能芯片,以解决汽车、光子学、太空和医疗设备等广泛领域的一个特定问题。Synopsys云上市和产品战略主管
Bhatia指出,他们在内部使用人工智能来帮助削减云现货市场的成本,例如,通过提醒客户,云提供商可能会终止工作。然后,它会自动将该作业移至不同的虚拟机。
Arm中央工程执行副总裁加里·坎贝尔 (Gary Campbell) 表示:“人工智能正在从根本上改变我们的生活和工作方式,这种转变只会在未来 12
个月内加速,而且远远超出这个范围。” “到 2024
年,围绕人工智能的讨论将变得更加细致,重点关注不同类型的人工智能、用例,以及最重要的是,我们需要建立哪些技术基础才能使人工智能驱动的未来世界成为现实。先进的专用芯片将在当今人工智能技术的扩展和推动其部署的进一步进步方面发挥关键作用。CPU
在所有 AI 系统中都至关重要,无论是完全处理 AI 工作负载还是与 GPU 或 NPU
等协处理器结合使用。因此,人们将更加重视这些算法的低功耗加速以及在计算能力较强的领域运行人工智能工作负载的芯片,例如大型语言模型、生成式人工智能和自动驾驶。”
此外,许多人希望利用人工智能来增强现有流程并提高生产力。Synopsys 产品线管理高级总监 Arvind Narayanan
表示:“在芯片设计流程中,有很多机会通过引入人工智能来优化生产力。” “工艺几何尺寸的减小带来了一系列挑战,但设计芯片的时间要么保持不变,要么甚至更短。预计到
2030 年,劳动力将出现严重短缺,设计师数量将减少 20% 至 30%。像人工智能这样的变革性技术可以帮助填补这一空白。”
数字孪生和数据中心
人工智能对芯片设计工程师的潜在价值还有许多其他例子,例如将大型语言模型与数字孪生集成。Cadence高级产品营销经理 Dave King
表示:“随着数字孪生的指数级增长,到 2030 年,市场规模将达到 111.2 亿美元,更多的人将能够获得并希望使用数字孪生。”
“这就是为什么我们可能会更希望将LLM纳入数字孪生技术中,使它们成为工作场所决策中更加关键的要素,因为法学硕士使操作员能够以自然的方式提出数字孪生问题。”
尽管目前人工智能热潮不断,但其在数据中心的使用可能会稳定下来。“人工智能将继续在数据中心使用,以帮助解决已被证明有效的较小问题。这些任务包括填补体力劳动缺口、提供能源管理建议或自动化容量管理等任务,”King
说。“尽管如此,在解决重大挑战时,例如鉴于当前的技能差距,人工智能还不会被视为主要解决方案,例如运行数据中心而不是人类操作员。因此,我们可能会看到人工智能领域的投资带来更直接的小规模收益。”
数据中心也开始与边缘共享训练和推理,从而实现更多分布式智能和实时响应。Arteris首席营销官 Michal Siwinski
表示:“边缘人工智能推理意味着智能边缘绝对在企业运营方面向前迈出了一步,而且是全面的。”
“例如,我们将看到更多与汽车的交叉。消费者和工业基本上正在从简单的电子产品转向相当先进的电子产品。这是一个巨大的破坏。”
人工智能的影响力正在蔓延
可运行人工智能的芯片类型也在发生变化,这在边缘尤其重要。例如,DSP
在视觉、音频和激光雷达等垂直市场中执行一种特定类型的处理非常高效。现在,随着人工智能在各地的推广,人们正在推动扩大这种能力。
Cadence 的 Tensilica 音频/语音 DSP 小组产品营销总监 Prakash Madhvapathy 表示:“这样做的动机包括需要减少
SoC 面积并限制总体功耗。” “在基于边缘和设备上的人工智能应用中,独立的 DSP 或 DSP
与高效加速器结合使用,对于从微型耳塞到自动驾驶等一系列应用来说是非常理想的。虽然人工智能加速器可能或多或少独立工作,但趋势是将其与具有人工智能功能且高度可编程的
DSP 配对,以作为面向未来的有效后备,以防不断发展的人工智能工作负载引入新颖的神经网络。”
定制化
与此同时,定制化(尤其是定制芯片)的发展,正在增强人们对软件定义架构(SDAs)的兴趣,其中功能由软件定义。“该产品实际上是一个软件产品,”
Imperas (现为 Synopsys的一部分)首席执行官 Simon Davidmann
指出。“看看特斯拉就知道了。有大量的芯片、数百个处理器,但定义这一切的是软件。软件是预先设计和架构的,然后由芯片执行。这意味着你必须预先进行大量模拟。”
SDAs 对定制芯片的需求与RISC-V相吻合,在最近的 RISC-V 峰会上,Meta 宣布将在其路线图中的所有产品中使用 RISC-V,从而推动了
RISC-V 的发展。
Davidmann 表示:“我们看到 RISC-V 越来越受到芯片设计人员的兴趣,因为它给了他们自由。”
“例如,我们正在与一家公司合作,该公司正在构建具有 512
个小核心的新型激光雷达芯片。他们无法用他们可以获得的许可来制造它,所以他们必须自己建造它。他们不想发明自己的产品,所以他们选择了 RISC-V。”
RISC-V International 首席技术官 Mark Himelstein 对前景持乐观态度。“RISC-V
软件生态系统不断发展,取得了一系列里程碑,包括创建 RISE 项目以帮助加快 RISC-V 开源软件的发展、RISC-V 国际格局和交流,使开发人员能够宣传
RISC-V 的可用性软件。”
但这不仅仅是 RISC-V 的问题。“人们正在构建混合架构 SoC,这带来了一系列完全不同的挑战,”Arteris 的 Siwinski
说道。“突然之间,你从一个稍微封闭的生态系统转变为必须跨所有标准互操作的生态系统。我们如何将它们缝合在一起?这是关键挑战之一。”
答案可能是芯粒,它最终将变得更加标准化。“我们将看到有关小芯片如何协同工作的更多标准化,”Siwniski 说。“芯粒将成为另一种必须集成的
IP。”
其他人也同意。“随着代工技术的进步和摩尔定律的放缓,半导体行业需要找到新的方法来实现性能提升、成本降低和良率提高。这就是为什么芯粒将在 2024
年成为整个行业的焦点。”Arm 执行副总裁兼首席架构师 Richard Grisenthwaite
说道。随着这项技术的普及和小芯片市场变得更加多样化,重点将转向标准化和互操作性,以确保这些更定制的芯片以最快的方式进入市场,从而能够在不同的市场中重复使用。到
2024 年,我们预计整个行业将齐心协力,更清晰地定义系统级功能和基础标准,使芯粒能够在更广泛的系统中使用,而不会产生碎片化风险。”
继续向左移动
小芯片和 RISC-V 扎根的关键原因之一是新工艺节点不再保证性能和/或功耗的改进。SoC
正在被分解为各个部分,并且所有这些部分都需要表现为一个系统。这需要更多的定制、更多的协同设计以及在流程的早期更好地理解整体架构。
“随着软件定义架构的发挥作用,您必须更多地关注前期的系统设计,”是德科技射频/微波、电力电子和设备建模 EDA 业务高级总监兼产品组合经理 Nilesh
Kamdar表示。“以后你不能再碰运气了。整个工作流程,从验证一直到流片,都必须预先弄清楚、定义和设计。你不能只是希望并祈祷它最终会走到一起。”
但这并不意味着事情变得更简单。Fraunhofer IIS 自适应系统工程部混合信号自动化组经理 Benjamin Prautsch
指出,复杂性稳步增加的趋势仍将持续。“因此,任何有助于‘左移’的活动都将被追求。这里的一个关键支柱是 EDA,它面临着各种挑战,例如用于系统分区的
EDA(包括基于小芯片的系统)、用于高级数字合成的 EDA,以及用于模拟设计和验证的 EDA。”
将所有这些部分融合在一起并不是一件简单的事情,需要关注真正的系统级设计以及所有部分如何组合在一起。“用户知道他们需要进行真正的基于模型的系统设计,特别是对于软件定义的、硅支持的系统,”西门子
EDA的 IC 验证解决方案战略总监 Neil Hand
说道。“他们想知道起点,因为这与本地优化非常不同。当您尝试进行系统设计和全局优化时,这是一系列全新的挑战。”
这将需要新的工具。“真正的系统级设计的挑战之一是如何在域之间进行通信,”Hand说。“如何以使其可用于另一个领域的方式抽象详细模型?当您开始查看左移时尤其如此。如何获取流程级信息并使其可供系统设计工程师使用?其中很大一部分将通过人工智能/机器学习创建模型来实现,这些模型允许系统设计的其他领域发挥作用。例如,它可用于创建复杂
SoC 的抽象系统模型,以便您可以在数字孪生中使用它。”
量子计算
2023年底,量子计算取得了两项重大突破。首先,IBM 推出了“IBM Quantum
Heron”,这是一系列新的公用事业规模量子处理器中的首款产品。该公司还推出了 IBM 量子系统二号,这是 IBM
的第一台模块化量子计算机,也是其以量子为中心的超级计算架构的基石。
其次,DARPA
团队创建了有史以来第一个带有逻辑量子位的量子电路,这是实现容错量子计算难题中的一个关键缺失部分。逻辑量子位经过纠错以维持其量子状态,使它们可用于解决各种复杂问题。IBM
的成就令人兴奋,足以吸引 60 分钟的记者,他滔滔不绝地谈论通过前所未有的计算实现的生物医学突破。
但量子时代也伴随着一个巨大的警告。Rambus高级首席工程师斯科特·贝斯特 (Scott Best)
表示:“实际上,在我们的有生之年,总会有人研制出与密码学相关的量子计算机。”
“有了这样一台机器,数学家已经找到了如何破解所有数字签名算法和密钥交换算法的方法。”
因此,任何在 2024 年设计芯片的人都必须解决传统加密方案在新芯片上市时被破解的可能性。“人们针对某些加密算法进行的一些模拟是合法的。它们可能会在
2025 年到位。” Flex Logix营销和业务开发副总裁 Jayson Bethurem
说道。“今天做出的有关安全的决定将不可避免地是错误的。防止他们出错的唯一方法是在您的设备中保留某种动态加密,或者我们所说的“加密敏捷性”,例如 AES
算法。”
更多数据、更高性能和可持续性
数据不仅仅通过线路传输。它还会在大气层中移动,发送端和接收端都需要大幅改进技术来处理大量增加的数据。这就是 5G 毫米波和 6G 的用武之地。
“在射频和毫米波领域,正在发生巨大的飞跃,这主要是由 6G 推动的,”是德科技的 Kamdar 表示。“当我们看到 5G 的一些后期阶段,以及 6G
的发展时,这将是一个巨大的飞跃。本质上,您将从 6GHz 或更低的载波频率变为 28GHz 到 100GHz
的任何载波频率。这意味着核心半导体技术、信号的核心调制以及您应用的品质因数可能都必须完全改变。市场的巨大变化使得大多数公司无法继续使用过去的设计技术和工作流程。他们必须想出全新的工作方式。”
这包括射频和基本主力——混合信号芯片。可能最早会在 2024 年进行设计改进。在此,DARPA 表示计划宣布一项建立 RF
异构集成标准的举措。Kamdar 表示,鉴于人们对量子、光子学和 WiFi
的兴趣,射频设计正成为最“可挖走”的员工技能列表中的前列。“我真的鼓励更多的学生和年轻的职业专业人士思考这个领域。许多公司一旦发现你拥有合适的射频背景,就会抓住你。”
这只是其中的一部分。人工智能的需求也将使内存、功耗和性能成为工程关注的首要问题。Fraunhofer IIS/EAS 高效电子部门负责人 Andy
Heinig 表示:“随着基于日益复杂性的新型生成式人工智能的不断推出,对高性能处理器的需求也在不断增加。”
“这里的一个关键趋势是所有层级都需要更多内存。生成式人工智能的需求也加速了对高度特定硬件实现的需求。结果,整个系统的功率密度将大幅增加,但在电力传输和散热方面会出现问题。”
解决这些电力挑战的需求是由财务和环境问题推动的。Ampere 首席产品官 Jeff Wittich 表示:“进入 2024
年,人工智能将成为促进剂,其中可持续性和效率将成为计算能力增长的主要障碍。”
“如果不解决效率低下的问题,增长可能会停滞,因此企业将比以往任何时候都更加重视它。”
监管问题也推动了可持续发展举措。“随着我们越来越接近一些监管要求,例如在加利福尼亚州只允许电动汽车前进或其他特定的碳目标,系统公司正在考虑缩短时间并确保一切都按照可持续发展标准建造,”
Arteris 的 Siwinski 说道。“由于截止日期临近,许多创新正在加速。”
Untether AI 产品副总裁鲍勃·比奇勒 (Bob Beachler)
表示,对可持续性的担忧可能会挑战甚至毁灭最受欢迎的人工智能场景之一。“如果今天世界转向 100%
自动驾驶汽车,对温室气体的影响将比目前全球所有数据中心的所有计算机的影响还要大。如果我们希望自动驾驶汽车上路,传统的自动驾驶汽车方法不具备使其工作所需的“人工智能马力”。我们需要一种更加节能的方式来部署人工智能,让自动驾驶汽车上路。”
2024年之后:可靠性和抗辐射性
更多电子产品具有多方面的价格标签。例如,缩小数字设备在美元、设计时间和可靠性方面的成本更高,并且每一类都可以进一步细分。密度越高意味着放射性粒子撞击重要部件的可能性就越大。解决方案包括辐射强化和冗余,这两者都可能导致组件成本增加
25% 至 50%。
Flex Logix 首席执行官 Geoff Tate 表示:“在较低节点,可靠性可能会受到 α 粒子的影响,这可能导致开发人员需要更昂贵的抗辐射芯片。”
“我们可能会看到适用于所有类型存储元件和高级节点的更强大的抗辐射设计技术。你不能让内存元素变得越来越小。我们并没有摆脱阿尔法粒子。它们在我们的太阳系中。”
虽然这可能不是许多应用程序的迫切需求,但泰特预测请求将会增加。“对于大多数商业客户来说,在本世纪末之前,使组件具有抗辐射能力可能不会成为问题。我们刚刚开始看到商业客户需要抗辐射存储元件来实现某些超高可靠性的商业应用。”
西门子之手也同意这一观点。“进入 2024
年,可靠性将变得更加重要。你会看到更多的公司正在考虑需要什么,”他说。“无论是抗辐射、功能安全还是其他技术,都将取决于哪种机制适合当前的系统。”
结论
尽管取得了所有突破和令人兴奋的成果,但工程和商业的基础仍然存在。“每个人都必须提高设计和实施流程的效率才能完成工作,”Imperas 的
Davidmann 说。“如果你不够快到达那里,其他人就会抢先一步。”
随着新问题的出现,市场上充斥着寻求解决问题的初创公司,而大公司则因为技术、人才或两者兼而有之而收购了它们,企业整合是可能持续下去的另一个趋势。然而,正在改变的是所有这一切发生的速度。随着新技术的推出,它正在加速发展,而且这种情况只会持续整个十年,并持续到下一个十年。技术将继续存在,而半导体是使这一切发挥作用的引擎。
本文编选自“半导体行业观察”微信公众号,智通财经编辑:何钰程。