对于大模型,马化腾宣称“腾讯不急于一时”的发言,与之后紧锣密鼓的投资动作,两者或许并不矛盾。
继5月中旬腾讯股东大会上,马化腾宣称“AI是几百年不遇的机遇……现在很多公司太急了,腾讯一贯不是这种风格”之后,6月的腾讯在投资方面多少有些口是心非。
5月31日,北京深言科技有限责任公司发生工商变更,股东新增腾讯旗下广西腾讯创业投资有限公司。
6月1日,路透社报道,国内通用大模型初创企业 MiniMax 完成了超2.5亿美元新一轮融资,本轮融资中,有腾讯关联的实体参与,参投资金或为4000万美元。
6月5日,美团联创王慧文的AI初创公司光年之外,被爆出完成了2.3亿美元新一轮融资,源码资本作为领投方,腾讯紧随其后,五源资本、快手创始人宿华均有出资。虽然之后王慧文在朋友圈表示融资额度、估值都不准确,但对于投资方并未否认。
在这波密集投资之前,这波AI大模型浪潮中,腾讯一直显得过分低调。以至业内都在疑惑 “腾讯到底准备如何做?”
而如果把马化腾宣称“腾讯不急于一时”的发言,以及之后紧锣密鼓的投资动作结合起来看, 腾讯的“口是心非”至少透露出三点重要信息:
1、腾讯将以投研并举的方式发展大模型,这一点与微软类似。
2、腾讯的自研大模型面世还需要较长时间,应用端应该是腾讯短期内可见的发力重点。
3、在国内大模型竞争中,腾讯已经成为后来者,但还在以一种更为谨慎的态度找一锤定音的机会。
投研并举,腾讯向微软看齐
值得注意的是,在股东大会上表示AI是几百年不遇的机遇,并批评某些公司操之过急后,马化腾特别补充道: “一个公司不能包揽一切,(腾讯)要了解自己的优势,抓住适合自己的机会,并把自己擅长的事情做到极致。”
换言之,面对如火如荼的大模型市场,腾讯并非真的不着急,而是在找寻合适的入局方式。
而投研结合,正是腾讯擅长的事。
自从2011年腾讯改变策略,开启对外投资以来,十多年来腾讯公开对外投资 超过千起,投出了 美团、滴滴、拼多多、京东、快手、哔哩哔哩、知乎 等一众知名互联网企业,腾讯也一度被称为“成了一家投资公司”。
而本次腾讯投资的三家大模型企业也均实力不俗。
Minimax与商汤联系颇深, 联合创始人为前商汤科技副总裁,通用智能技术负责人闫俊杰,是前商汤研究院副院长。据其技术合伙人杨斌介绍, Minimax自研了三个基础模型:文本到文本( text to text)、文本到视觉(text to visual)、 文本到语音(text to audio )。
深言科技出身清华系, 孵化自清华大学自然语言处理实验室(THUNLP)和北京智源人工智能研究院,由欧洲科学院院士、清华大学计算机系教授孙茂松领衔担任公司首席科学家。目前,团队已发表顶会顶刊论文数百篇,获得各类知识产权数十项。
光年之外虽然还没推出具体产品,但创始人王慧文无疑是一张金字招牌。在王慧文发布“AI英雄榜”后,北京智源人工智能研究院副院长刘江,有搜狗输入法之父称号的马占凯等人纷纷加入团队,美团CEO王兴也以个人身份参与光年之外A轮融资,并出任董事。
当然,如果将大模型视作是下一个时代的船票,想仅仅依靠投资入局,对于站在食物链顶端的腾讯来说,自然远远不够。因此 腾讯也在埋头研发自己的大模型。
根据公开信息, 腾讯混元大模型能力包含但不限于:计算机视觉、自然语言处理、多模态内容理解、文案生成、文生视频等多个方向。 腾讯宣称,混元AI大模型是目前国内首个低成本、可落地的NLP万亿大模型,登顶过自然语言理解任务榜单CLUE。
想在大模型领域取得成功,这种 “对外投资+内部研发” 的模式,已经被微软证明了有效。
在内部研发方面,微软长期将AI放在核心位置。
微软的AI研究团队,人数一度达到8000人。早在2009年,微软内部研究团队就开始开发用于语音识别和文本生成的AI模型。2020年当时史上最大的170亿参数的Transformer模型,也是由微软发布。
对外投资方面,微软CEO纳德拉在2019年力排众议,豪掷10亿美元押注OpenAI,并给予强大算力支持。
最终微软与OpenAI实现了深度绑定,从Bing,到Office,再到Windows,微软不断将OpenAI技术并入旗下产品,借着ChatGPT引发的全球AI浪潮,老牌科技巨头也重新回到了舞台中央。
很明显,腾讯也想借鉴微软的成功模式; 对外投资最具潜力的AI企业,利用自身资金、数据、算力等资源提供帮助;内部同步展开研发,最终将外部技术融入自身生态,实现优势互补。
自研大模型还要时间,应用端会是短期重点
尽管投研结合的大方向已逐渐显现,马化腾也表示,“就基础模型而言,腾讯正在取得良好的进展。”
但从最近密集的投资动作来看,腾讯大模型距离真正大规模面世,还有相当一段时间。
原因很明显,腾讯最新投资的三家企业都致力于自研大模型,如果近期腾讯自研大模型计划面世,考虑到竞争关系,腾讯应该不会在当前阶段,耗费上亿美金去投一批自研大模型的企业。
而相比于自研大模型这个长线任务,短期来看, 尝试将应用端优势与大模型融合, 应该是腾讯的重点。
马化腾在股东大会上表示:“腾讯的一个关键优势显然是应用场景,我们有不同的产品。我们的团队已经在计划一些有趣的产品。”
在近期,在AI应用端可以频频看到腾讯的身影。
3月30日,腾讯发布了全新的AI智能创作助手“腾讯智影”,推出了智影数字人、文本配音、文章转视频等AI创作工具。
简单来说,智影数字人能实现“形象克隆”和“声音克隆”,创作者只要上传少量图片、视频和音频素材,AI就会自动生成使用者的数字人分身和定制音色,并生成用户的数字人说话视频。
5月16日,知名AI绘图工具Midjourney,选择以QQ为载体,开启官方中文版内测。由于用户参与热情过于高涨,导致内测名额一票难求。
而如果将应用端视为短期内发力的重点,腾讯本次对自研大模型企业的投资动作,也更加顺理成章。
首先, 本次被投企业此前有基于自研大模型开发爆款应用的经历。 MiniMax去年11月发布过to C虚拟聊天软件产品Glow,上线四个月后用户达到500万人。
深言科技的WantWords产品,中文名叫反向词典,曾在2021年11月一度走红微博,服务器被多次挤爆。
而王慧文作为美团联创,曾为美团扩张立下汗马功劳,对于如何打造爆款应用,也是熟门熟路。
更进一步,将自身在应用端的资源、数据等优势,应用于外部大模型,合作开发一些“有趣的产品”,投放市场检验,对于腾讯来说,无疑是一种更安全稳妥的方式。
毕竟谷歌对标ChatGPT推出的聊天机器人Bard,由于展示效果不及预期,当天市值蒸发千亿美金的例子就在眼前,腾讯有理由谨慎。
后来者腾讯,在找一锤定音的机会
谨慎的态度,让腾讯在国内大模型竞争中,成为了不折不扣的后来者。
实际上,在过去很多年,这也是腾讯的贯用手法—— 让竞争对手先跑,完成市场验证后,自己再出手占领市场。 在移动互联网时代,腾讯就曾凭借微信后发制人,达到了一锤定音的效果。
当前国内大模型的竞争格局,也仍留有时间窗口。行业对于大模型的技术路线、商业模式、应用场景、最终归属都还在摸索。
尽管百度、阿里、360、中科院、商汤等各路玩家都在跑步入场,但正如马化腾所言: “对于工业革命来说,早一个月把电灯泡拿出来,在长的时间跨度上并没有那么重要。”
就目前来看,腾讯似乎还想保持自己的风格。在核心的数据和算力方面,腾讯也的确存在优势。
首先相比于英文语料库,高质量的中文语料库要少许多。
而无论是腾讯内容生态系统中的高质量数据(如腾讯视频、腾讯游戏),还是腾讯内部的数据(如微信、QQ),对于整体中文数据库而言,都是一个重要的补充。
算力方面,今年4月,腾讯云发布了面向大模型训练的新一代高性能计算集群,整体性能比过去提升了3倍,是国内性能最强的大模型计算集群。
当然, 尽管拥有纸面优势,如果腾讯将研发周期过分拉长,越往后期,腾讯将愈发被动。在大模型领域,很多大厂以往的优势也不一定能奏效。
首先,AI创业公司来势汹汹,大厂面临巨大的挑战。
在以往,谷歌被认为对AI几乎处于垄断地位。甚至OpenAI成立的初衷,就是为了对抗谷歌的闭源行为。
而现在,ChatGPT一跃成为历史上用户增长最快的应用,其与微软必应搜索引擎的结合,更是直指谷歌的核心搜索业务,OpenAI打了曾经的AI霸主谷歌一个措手不及。
而在国内,AI创业公司也正如雨后春笋般出现,其中既有清华系、复旦大学、智源人工智能研究所等顶尖科研院所,也有李开复、王小川、周伯文等科技大佬,各方都在想着以创业公司颠覆行业格局。
另一方面, 大模型技术迭代按周计算,互联网大厂的传统研发套路很难奏效。
最明显的例子,OpenAI直到今年1月都只有375名员工;全球知名开源社区HuggingFace,只有200多名员工分散在全球,公司估值已超过20美金;火热的AI生成图社区Midjourney,目前已有1600万用户,年收入一亿美元,公司只有11人。
这意味着, 以往互联网大厂习惯的堆人、砸钱、砸资源策略,在大模型时代不一定适用。
移动互联网时代,腾讯最擅长内部赛马,这一机制曾帮助腾讯无往不利,最终跑出了微信,但考虑到大模型训练的高昂成本,以及更长研发周期,腾讯赛马机制的威力恐怕很难继续保持。
最后,随着国内外各大科技公司、科研机构前赴后继,涌入AI大模型赛道, 越晚来的玩家,势必面临更高的市场期待。
根据中国科学技术信息研究所所长赵志耘发布《中国人工智能大模型地图研究报告》,目前中国10亿参数规模以上的大模型已发布了79个。
而腾讯在研发创新领域沉寂已久,当同行们将竞争门槛进一步拉高,届时腾讯能否匹配过高的市场预期,仍是未知数。