国产AI大模型赛道热闹非凡。
编者按:本文来自微信公众号 刘旷(ID:liukuang110),创业邦经授权发布。
随着ChatGPT在全球范围内迅速爆红,AI大模型赛道的热潮也开始从国外涌向国内,并随之急速升温。而作为新一代的颠覆性技术,AI大模型一度被视为一次全新的生产力革命。因此,各路玩家都围绕“AI大模型”发布了一系列产品,国内AI界也开始上演一场关于“大模型”的战争。
纵观国内当下涉足AI大模型赛道的玩家,主要可分为以阿里、腾讯、百度等为代表的互联网厂商和以商汤科技、昆仑万维、科大讯飞等为代表的科技公司,以及以王小川、王慧文等为代表的初创企业。而正所谓,八仙过海各显神通,这三类不同属性的参与者在这场“千模大战”中也展现出了其独特的优势。
国产AI大模型赛道热闹非凡,互联网厂商们纷纷摩拳擦掌。百度和阿里先后上线了各自的大规模语言模型“文心一言”和“通义千问”;腾讯、网易、京东也相继公开了自家的大模型产品“混元”、“玉言”和“ChatJD”。而一众互联网大厂之所以能够竞相推出自己的AI大模型新品或研发计划,其背后的实力不容小觑。
首先,互联网大厂拥有雄厚的资金储备,能够长期有效地支持其AI大模型的创新和研发。高算力代表着高成本,这就意味着AI大模型需要高昂的训练费用和研发投入,而没有雄厚的资金支撑,几乎没有跑完全程的希望。相比较而言,互联网大厂资金储备充足,能保证大模型的正常运行。据公开资料显示,无论是百度、阿里还是腾讯,每年研发投入资金就高达百亿元,研发团队人数破万,在技术研发上实力雄厚,是目前当之无愧的“第一梯队”玩家。
其次,互联网大厂积累了海量数据参数,可以在一定程度上提升AI大模型的能力和效用。数据是大模型的基础,目前来看,通过大规模数据训练超大参数量的巨量模型,被认为是非常有希望实现通用人工智能的一个重要方向。而“BAT”等互联网大厂流量大、用户覆盖面广,能够为大模型的生成提供足够的数据参数。比如,“文心一言”背后有百度的海量搜索数据和语料库;阿里的“通义千问”则有来自电商、云计算等领域的语料库。
最后,互联网大厂丰富的应用场景和大模型十分贴近,可以让AI大模型的落地变得更容易。互联网大厂分别来自电商、社交、游戏、教育等诸多行业,并且拥有面向用户的多个产品和服务,如百度和360的搜索、腾讯的社交媒体、阿里的云计算和电商等,其主营业务十分贴近大模型应用场景,而基于其原有业务在资源和技术上的积累,这些互联网大厂则是最有机会推动模型技术向C端用户普及的玩家。
在互联网大厂积极布局AI大模型之时,科技公司的身影也异常活跃。商汤科技宣布推出了“日日新”大模型体系;昆仑万维和奇点智源合作自研了大语言模型“天工”;科大讯飞也发布了“星火”大模型。而科技公司之所以能够争先恐后地推出自己的AI大模型方案和发展计划,则与其自身强大的底气不无关系。
一方面,科技公司在AI大模型的应用探索上已取得了一定的先发优势,这有助其率先抢占用户心智。凭借超前的战略眼光,大多数科技公司多年前便已展开了人工智能技术在各业务领域的应用探索,并将相关技术全面应用到旗下社交娱乐、信息分发等业务板块,且现已取得一定的先发优势。比如,昆仑万维在2020年就已经开始领先布局AIGC,耕耘三年,如今发布的“天工”3.5也被其自称为将是“中国第一个真正实现智能涌现的国产大语言模型”。
另一方面,科技公司在人工智能等技术上有着深厚积累,可以为AI大模型的落地提供强有力的技术支撑。包括商汤科技、科大讯飞等在内的科技公司早在ChatGPT火爆之前,就有了大量关于人工智能的积累。比如,作为国内领先的人工智能企业,科大讯飞不但拥有丰富的AI技术积累和经验,目前还建有业界一流的AI数据中心。而凭借在AI技术领域的巨大优势,这些科技公司更有可能做出真正意义上的类ChatGPT的自然语言生成的大模型。
另外,科技公司在AI技术应用上的商业化落地经验,能为其AI大模型商业化落地提供借鉴。由于在AI领域的长期积累,大多数科技公司已经通过建立技术优势,以及AI产业化实现了盈利反哺技术研发,形成了可持续发展的商业模式。比如“AI四小龙”之一的商汤科技,就有着超过20年的AI原创技术,并且其领先的AI技术正不断落地在生活场景中。而随着其AI技术应用逐渐规模化落地,其商业化也在随之加速。
在互联网大厂和科技公司开卷之际,创业公司也在AI大模型的风口中找到了机会,又为这一领域添了一把火。原美团联合创始人王慧文的一则“AI英雄榜”,宣布高调入局“剑指”大模型;随后,前搜狗CEO王小川、前京东AI掌门人周伯文、被誉为“AI框架领域第一华人”的阿里技术副总裁贾扬清等一众大佬也争先加入了AI大模型的创业队伍。而这些创业企业之所以能够成为杀向大模型赛道的一匹黑马,当然还是得益于其得天独厚的优势。
一是,初创企业更敏锐,能够快速洞悉AI大模型的市场需求并展开相应业务。互联网时代竞争激烈,各企业都在抢占市场盲点,想要凭借先发优势占得市场份额的高点。相比较而言,初创企业往往具有更敏锐的市场洞察力,能够迅速发现市场中未被充分满足的需求,也更容易适应市场需求并做出战略调整,从而推出具有独特性和优势的产品和服务。
二是,初创企业更灵活,可以基于大模型进行“再开发”,以挖掘新的交易机会。由于初创企业往往充满探索精神,因此其可以选择的商业模式也更为多样化,除了利用AI大模型为自己打工,AI创业者们还能基于大模型进行“再开发”,尤其是一些基于AI大模型发展的垂直应用场景,也有可能成为企业新的增长机会。比如,使用文心一言大模型,基于其语音和文本处理功能,开发者可以再增加线上记账小模型,用语音输入实现实时记账。
三是,初创企业更专注,有足够的时间和精力去研究和开发出AI大模型更多的场景和功能。众所周知,无论是互联网大厂还是科技巨头,往往都有着多条业务线,因此,各项资源就会比较分散,而作为其若干个业务中的一个,大模型领域能被分到的资源就十分有限。相比较而言,初创企业更专注于一项业务,会通过聚焦产品本身进行深度思考,从而精准挖掘用户需求,设计出让用户满意的产品,让用户更愿意为之买单。
为了追逐AI大模型的浪潮,无论是互联网大厂,还是科技公司,亦或是初创企业,无一不都亮出了绝招。国内的AI大模型已然遍地开花了,至于谁会成为最后的赢家,目前虽尚无定论,但值得注意的是,每一个狂热赛道的背后往往不乏担忧,而追逐大模型的玩家自然也都面临着共同的难题。
一来,AI大模型在算力、算法等核心技术方面都还不太完善,还有很大的进步空间。在AI时代,生产力的三要素分别是应用场景、专有数据和基础模型。然而,大模型技术应用范围虽然广泛,但目前落地的场景却比较有限。而且当前国内算力稀缺、数据模型训练不足,甚至版权纠纷等问题依旧难以忽视。更何况,本身缺乏核心技术、套用别家公司硬件或数据库来预训练参数的也不在少数,可见,国产大模型还有很长的一段路要走。
二来,AI大模型顶级的技术人才是稀缺资源,各玩家之间的抢人大战将难以避免。随着大模型越来越火热,高精尖的技术人才就成了兵家必争之地,大厂们更是毫不吝啬地开出百万年薪来争夺。根据脉脉发布的《AIGC⼈才趋势报告》显示,自OpenAI推出的2021年以来,对于AIGC相关人才的争夺就已经开始了。2021年1-2月,AIGC相关岗位招聘同比上升281.88%;2022年和今年的1-2月,招聘数量分别保持了76.74%和31.3%的同比增幅。
三来,AI大模型目前的落地场景还较为有限,商业化想要彻底跑通恐怕还需要时间。无论是对哪个行业而言,商业化都是极为难过的一关。即便是技术领跑全行业的openAI,在商业化方面也有着不小的烦恼,比如,openAI的估值虽然随着ChatGPT的走红而一路高升,但每一次预训练参数都要耗费巨资,因此其亏损也在持续扩大。其他玩家的商业化尝试恐怕也是收效甚微,短时间内几乎不可能覆盖预训练所需成本。
总而言之,对所有参与的玩家来说,大模型无疑是一场艰苦的马拉松竞赛。而且,随着国内各种大模型接踵而至,“百模大战”也已经正式打响,留给参与者们的时间似乎并不算多了。而待到潮水消退,国内的AI大模型玩家们恐怕只有坚持做自己,才能够在这场竞赛中走得更长远些。