导语:2023年,乘风大模型浪潮,作为原动力的算力成为全球焦点。但当英伟达以“卖铲人”身份赚得盆满钵满的时候,危险的信号也已时时预警:一面是新一轮人工智能掀起全球算力贴身“肉搏”的紧迫现实,一面是电子芯片摩尔定律接近失效、高耗能、低性能情况越发突出的力不从心。
“集成光路将是半导体领域60年一遇的‘换道超车’。”近日,我国首份光子产业白皮书《光子时代:光子产业发展白皮书》(以下简称《白皮书》)在2023全球硬科技创新大会上发布。前言的最后一段,写下了这样一句话。
2023年,乘风大模型浪潮,作为原动力的算力成为全球焦点。但当英伟达以“卖铲人”身份赚得盆满钵满的时候,危险的信号也已时时预警:一面是新一轮人工智能掀起全球算力贴身“肉搏”的紧迫现实,一面是电子芯片摩尔定律接近失效、高耗能、低性能情况越发突出的力不从心。
“你相信光吗?”几年前的语境下“光”是光伏,现在成了光芯片。重压之下,传统芯片捉襟见肘,但这束光能否照进现实实现曲线救国,仍需要技术和时间的验证。
光的世纪
“科技革命沿着‘机-电-光-算’的逻辑推演,21世纪将是光的世纪。”在综述部分,《白皮书》就做了这样一个预判。
2023全球硬科技创新大会平行论坛——2023光子产业发展暨硬科技成果转化论坛上,《白皮书》由中科创星创始合伙人、陕西光电子先导院执行院长米磊博士发布。而在2016年,米磊就曾提出过一个“米70定律”,他认为,光学技术会是未来一项非常关键的基础技术,其成本会占到未来所有科技产品成本的70%。
相比电子,光子的优势显而易见:传输信息时具有极快的响应时间,信息容量比电子高3-4个量级,具有极强的存储、计算能力,极强的并行、互联能力,以及超低的能耗表现。
这些优势让光子在信息产业迸发出了巨大的应用价值,聚光灯之下,光子芯片的时代同样到来了。
近年来,随着人工智能时代的到来,对算力的要求也水涨船高,但电子芯片已经逼近物理和经济成本的极限,以至于摩尔定律失效的讨论越来越多。进入2023年,大模型浪潮更在硬件供应和算力需求暴涨的错配下引发了“算力荒”,传统电芯片越来越捉襟见肘。
而光子芯片不仅能够对现有电子芯片性能进行大幅度提升,解决电子芯片解决不了的功耗、访存能力和计算机整体性能等难题,还可以在信息的获取、传输、处理等领域催生众多新的应用场景。
在接受北京商报记者采访时,米磊直言,人工智能时代是由算力支撑起来的,光子芯片就是下一代算力中竞争力显著的技术,且已经得到大厂验证,趋势非常明显。
“从这个角度判断,下一个时代将是光芯片和电芯片的融合”,米磊称,硅光技术能够有效提升GPU的整体性能、大幅降低其功耗,有效解决目前的算力瓶颈,“也就是说,下一代算力很可能会是光子计算甚至量子计算”。
有望突破算力天花板
9月中旬,芯片圈传来了个大消息。台积电将与博通、英伟达等客户共同开发硅光子技术,计划于明年下半年开始接受订单,预计在2025年实现量产。外界的评价是:有望突破算力天花板,成为下一代AI算力的“革命性技术”。
对于传言的真实性,北京商报记者联系了台积电,但截至发稿未收到回复。不过有业内人士告诉记者,事情本身是确定的,只是其中细节非常多,外界信息并没有那么准确。
光电芯片从业者李桦(化名)对北京商报记者分析称,台积电宣传的硅光技术,就是利用硅材料的优势,将硅基光电芯片和集成电路做系统集成,提升速度。
光子与电子的结合,被视为破解算力困境的“法宝”。特别是在国内市场电子芯片复杂、被动的处境之下,一个更迫切的问题摆在了面前:当下一轮全球科技竞争很可能聚焦在底层算力上,光子芯片能否在关键时刻顶上来?
事实上,理解光子芯片对于算力的跨越式支撑,其中还存在着一个概念上的“混淆”。
在接受北京商报记者采访时,洛微科技CTO孙笑晨指出,在提升AI计算方面,光电芯片可以在两个关键点发挥作用,其一是在神经网络计算本身起到加速器的作用,其二是通过芯片间更加密集的互联,增加数据传输带宽,从而在系统层面提高AI计算的整体性能。
“AI的大规模应用,对数据中心的算力提升有了很大的需求”,李桦称,这里的算力指的是单位能耗下的算力,一味增加CPU数量可以提升整体算力,但是会带来巨大的能耗。硅光技术的发展,可以提升数据中心的信息传输速度,并大幅度降低能耗,进而提升单位能耗下的算力。
李桦总结称,目前在光通信领域,光电芯片只是提升数据传输效率,数据的计算依然依靠集成电路来完成。
长春理工大学科学技术研究院常务副院长蔡红星也对北京商报记者提到,虽然在一些细分领域,光电芯片已经能够处理一些算法固定、流程简洁的计算,不过其成熟度远不如电子计算,尤其是在多元化的需求以及通用的人工智能计算领域,依然有赖于传统的电子计算。
但比起跟计算本身较劲,光芯片在互联方面发挥的作用很可能起到“曲线救国”的作用。
孙笑晨表示,当AI模型快速增大,对训练方面的并行和数据带宽需求越来越高,就需要芯片间进行更高效的互联以便提高整体性能,这种互联包括计算卡之间的互联、芯片间的互联以及芯片组内部计算和存储单元的互联。由于在带宽、功耗及速度方面的绝佳优势,光互连成为解决带宽需求的关键所在。
“这是一个完全可以预见的市场,在光互连模组和芯片方面,中国厂商也具备足够技术实力和市场优势。如果在这条路线上发力推动甚至先落地的话,国产AI计算很可能就会在整体上达到一个有竞争力的程度。”孙笑晨补充称,当下在提高AI计算能力方面,美国的主要技术思路仍然聚焦在了提高芯片本身性能上。
在光通信领域,光模块扮演着光、电信号相互转化的关键角色。根据LightCounting数据,2022年全球光模块企业TOP 10中,中国企业已占据7席,其中中际旭创等企业已实现800G高速光模块批量出货。
计算“跷跷板”
在业内看来,台积电联合客户开发硅光技术,瞄准的就是光通信在芯片互联方面的巨大潜力。“在光通信领域,光电芯片在数据中心上的应用,已经占据了一半的市场份额。”有业内人士说。
但从长远角度来看,在互连上的应用很可能会是光电芯片的“小目标”,其真正的星辰大海,仍然要落在计算本身。
据了解,一个巨大的AI模型中,每一层网络都需要进行矩阵运算,一个大矩阵还可能需要拆成几个小矩阵进行计算。也就是说,在大模型中,矩阵乘加运算是一个反复、循环的计算过程,每次循环,矩阵上的元素权重都会被更新。
“与电子相比,光的矩阵乘加运算非常快,但一涉及到权重的更新,光的速度就会变慢。”
孙笑晨称,从实际情况来看,光计算的瓶颈其实并没有卡在计算上,而是卡在了矩阵运算更新参数的阶段,“这就像是一个跷跷板,解决了一部分问题,另一部分问题又翘起来了,导致无法从整体上实现跨越性的性能提高”。
这也解释了为什么光在数学运算领域首先瞄准的方向是大模型的推理,而不是训练。因为训练需要海量数据的输入,不断重复计算动作时,效率上的问题就会更加突出。
目前业内普遍认同,光互连会比光计算先一步落地。孙笑晨认为,在光互连领域,要实现比较有竞争力的结果,也需要产业界整体的认可和合作,从产业链的角度、整个系统的角度合力进行技术攻关和商业落地。
李桦则将关注的重点放在了光电芯片整体的规模上。他提到,与集成电路市场相比,当下光电芯片市场体量很小,这也导致了从事光电芯片的企业,尤其是以生产线为主的企业,单纯做光电芯片的话,无法养活这条生产线,进而导致其无法投入更多精力做研发。
此外,如果单纯聚焦在光通信领域,体量也仍然大不起来,再加上短期内光计算体量很难出现大幅提升,除非出现更多应用场景,比如传感方面有更多的应用,可能才会解决这个问题。
在新技术的发展过程中,需求的作用不可忽视。
在采访中米磊说,任何一种技术取得突破,都需要长期的积累和投入,以及更长时间的转化和落地。“当然,这些都是一些实操的问题,只要有需求,很多技术和细节都能够慢慢解决,我们不用过于担心量产或者其他的问题,从长远看,有需求拉动的话,这些都不是问题。”
事实上,《白皮书》的开篇就做了这样一个结论:“对我国而言,既要在电子芯片领域尽快补短板,也要尽早在光子芯片等新赛道布局发力。双管齐下,抓住新一轮科技革命和产业变革的机遇,未来才有望实现‘非对称赶超’。”
(文章为作者独立观点,不代表艾瑞网立场)