6月29日,美团在港交所发布公告,宣布收购王慧文创办的大模型公司“光年之外”,这也给AI大模型市场留下了猜测。不只在国内,ChatGPT的访问量在近期增速下滑,数据显示,ChatGPT6月份的全球访问量环比降幅9.7%,独立访客数量环比下滑了5.7%。此外,用户使用ChatGPT的时长也在下降,5月份的每次访问时长下降了8.5%,AIGC似乎迎来了冷静期。
但另一方面,7月4日,李开复亲自筹组的大模型公司“零一造物”正式上线、百度开发的大语言模型“文心一言”APP上架苹果应用市场、企查查发布商查大模型——“知彼阿尔法”......各家公司在大模型领域动作频频,热火朝天。
AI大模型的创业有多火?资本市场对于这一风口的投资布局如何?如今的国产大模型表现如何?本期钛媒体·钛度图闻试图从数据层面梳理目前国产大模型的发展现状。
国内AI大模型“神仙打架”科技巨头竞相出手
从今年3月开始,国内的AI大模型如雨后春笋般涌现。《中国人工智能大模型地图研究报告》显示,截至2023年5月底,国内10亿级参数规模以上基础大模型至少已发布79个。
从全球来看,美国在大模型数量方面居全球之首,早在2020年,美国就已推出了15款大模型,其中包括GPT-3。而中国从2020年开始,大模型也进入高速发展阶段,2021年推出了30款大模型,2022年推出了28款大模型,2023年前5个月推出了19款大模型,超过美国的18款大模型。如今,中美两国大模型的数量占全球大模型数量的近90%,中国大模型数量已进入第一梯队。
国内大模型赛道热闹非凡,涉足AI大模型赛道的“玩家”有以阿里、腾讯、百度等为代表的互联网大厂,3月16日,百度领跑,推出中国版ChatGPT“文心一言”,随后,阿里、华为、腾讯、360等大模型陆续浮出水面。
此外,还有以商汤科技、科大讯飞等为代表的AI科技公司和教育类企业孩子王、金融类企业同花顺、房地产类企业我爱我家等为代表的各行业公司。另外,大模型在学术界也很火热,早在今年2月,复旦大学就已发布国内首个类ChatGPT模型MOSS。
值得注意的是,随着ChatGPT的火爆,国内还火速兴起了AI大模型的创业风潮,诸多科技大佬以及大厂高管等投身大模型,开启再创业。
2023年2月,原美团联合创始人王慧文发布“AI英雄榜”,高调入局AI大模型;同样高调入场的还有创新工场CEO李开复,3月19日,李开复在朋友圈宣布成立Project AI 2.0公司,进军AI大模型;随后,搜狗创始人王小川、前京东AI业务开路人周伯文、出门问问CEO李志飞等也都加入了AI大模型创业热潮。
除了这些科技大佬,很多互联网大厂高管也加入竞争。比如,快手前 AI核心人物李岩,成立了AI公司元石科技,进行多模态大模型的研发;李开复的“关门弟子”、依图科技10号员工周健成立了澜码科技,致力于重塑人机互动的模型。如今,国内AI大模型“神仙打架”,行业赛道十分热闹。
投资机构出手谨慎,市场高薪招聘大模型领域人才
入局大模型,首先要备好钱,毕竟大模型创业公司发布一个较为成熟的模型,需要投入大语言模型基础设施、训练和研发人才的成本。对于初创企业来说,融到钱才能活下去。
据钛媒体·钛度图闻不完全统计,截至2023年7月4日,今年获得融资的AI大模型创业公司融资金额普遍在千万到数亿元之间。其中,获得融资金额最多的是大模型初创公司MiniMax,其在6月1日完成了超2.5亿美元的新一轮融资,目前该公司估值超12亿美元,被冠以“腾讯首次投资的创企”称号。
此外,刚刚被美团收购的光年之外在6月5日完成A轮2.3亿美元融资,只不过在美团出手收购完成后,此轮融资也已被悉数退回。值得一提的是,成立于2021年的西湖心辰分别在今年3月、4月接连完成了两笔融资,融资速度很快。
而在AI大模型投资中,IDG资本、经纬创投、真格基金等头部VC的出手较少。
据钛媒体·钛度图闻不完全统计,腾讯投资、创新工场、奇绩创坛、红杉中国是较活跃的投资机构,投资企业均达到3家,其次是BV百度风投和智谱AI,投资企业分别为2家,大多数机构投资的企业仅为1家,而一向活跃的高瓴创投、深创投没有公开数据显示其进行过AI大模型赛道的投资,可见投资人对大模型创业这一赛道出手较为谨慎。
除了融资以外,技术能力也是影响大模型竞争的核心。大模型对于算法、算力和数据都有很高的要求,AI大模型需要高昂的训练费用和研发投入,一些互联网大厂和科技公司拥有更为深厚的资金和技术储备。
据钛媒体·钛度图闻不完全统计,2022年,华为在研发费用上投入1615亿元,成为研发投资资金最多的企业;其次,腾讯以614亿元排名第二,阿里以555亿元排名第三。互联网大厂每年研发投入资金就高达百亿元,另外还拥有实力雄厚的研发团队,在大模型赛道上是当之无愧的“第一梯队”玩家。
除了资金和技术,人才也是大模型竞争中不可或缺的一环。
在今年第一季度,各家公司对顶级AI人才展开了抢人大战。王慧文表示要拿出75%的股份邀请顶级研发人才,李开复喊话在全球范围内招募世界级人才,百度以25-40k/月薪资招聘AI大模型算法工程师、20-40k/月薪资招聘模型构架工程师;阿里以40-70k/月薪资招聘大模型训练及算法工程师,各大公司求贤若渴。
相关数据显示,今年一季度AI大模型相关职位的发布量同比增长10.16%,是与ChatGPT相关增长最多的领域,其中机器学习和算法工程师两个职位的招聘年薪中位数均达到40万元以上。
国产大模型发展挑战仍存,部分领域表现优于国际模型
过去半年,大模型陆续发布,它们目前实力如何?据相关机构对国内外10款AI大模型的测评,整体来看ChatGPT领先优势较为明显,综合数据位居第一。分板块来看,国内大模型在词句理解和知识题方面超越国外模型,即国产AI大模型对⽂字的基础认知和学习能⼒较强。
而在6个国产大模型中,“文心一言”的综合数据表现较为优异,尤其是在词句理解、编程、知识题以及翻译方面领跑国产大语言模型;在商务写作方面,国内产品表现最好的为“讯⻜星⽕”;在文学题方面,国内产品“天⼯3.5”得分率最高,为88.33%,与ChatGPT得分持平;在逻辑推理方面,“文心一言”和“讯飞星火”表现相当。
国内大模型在一些细分领域其表现是十分优异的,但与国外同类型产品还存在一定差距,在数据等核心技术以及落地场景方面还有很大的进步空间。
在数据层面,大模型的发展需要高质量的训练数据集。目前国内基于中文语义的大模型训练所需要的中文数据总量不够,而且质量不高,优质中文大模型训练语料的稀缺也加大了差距。
在算力层面,按数据中心容量来统计,2022年在这一领域领先的公司是谷歌、微软、亚马逊和Meta,这四个数据中心平台占全球自建数据中心总容量的7成以上;而目前国内虽已有像阿里、百度、腾讯等的一些头部科技企业完成数据中心建设,但在容量上和国外相比还有一定的差距。
在落地场景方面,不同细分场景落地的成本也是个问题。要想得到一个足够有效且好用的大模型,需要投入足够多且有针对性的语料,这意味着不同细分场景的落地需要大量的成本投入。
据估算,大模型训练一次的成本介于200万美元-1200万美元之间。由于训练成本过高,人工智能开发公司Open AI 2022年亏损达到5.4亿美元左右。所以AI大模型的商业变现还需要时间。
在这个竞争激烈的赛道上,即使困难重重,国内大模型都在朝着更完善的技术方向走去。而且赛道内的竞争也将加速国产大模型技术的发展步伐,推动中国AI产业的整体技术升级。
*数据来源:Structure Research、InfoQ研究中心、猎聘大数据、《中国人工智能大模型地图研究报告》等公开资料不完全整理。