大模型竞赛棋至中局，腾讯“混元”加入战场

观点

2023

09/07

20:31

亚设网

大模型竞赛棋至中局，腾讯“混元”加入战场

图片来源：视觉中国

中国市值最高的互联网巨头腾讯，在科技界的期待与压力之下，终于向公众披露了其通用大模型进展。

9月7日，在2023年腾讯全球数字生态大会上，腾讯混元大模型正式对外公布。据腾讯介绍，腾讯混元大模型拥有超千亿参数规模，预训练语料超2万亿tokens，具有强大的中文理解与创作能力、逻辑推理能力，以及可靠的任务执行能力。

此外，腾讯还表示，混元大模型已经接入腾讯50多项业务并取得初步效果，包括腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等业务和产品。

据腾讯称，混元大模型将作为腾讯云MaaS（Model-as-a-Service，模型即服务）服务的底座，企业用户不仅可以直接调用混元，也可以将混元大模型作为基底模型，为不同产业场景构建专属应用。

在大模型竞赛风起云涌的上半场，腾讯的动作并不算快。“我们最开始以为这是互联网十年不遇的机会，但是越想越觉得这是几百年不遇的、类似发明电的工业革命一样的机遇。AI非常重要，但这的确需要有很多的积累。”腾讯CEO马化腾于今年5月股东大会上的这句话，解释了腾讯的行动逻辑，他认为，对于工业革命来讲，早一个月把电灯泡拿出来在长的时间跨度上来看是不那么重要。

腾讯称，早在2020年，腾讯就开始研发混元，今年8月，混元已经进入公司内应用测试阶段，但一直没有披露最终进展。

在大会上，腾讯集团副总裁蒋杰表示，“在文档处理方面，混元优于国内某大模型，采纳率高出6倍，在Excel公式的准确性，也远远超过GPT 3.5；在广告业务场景方面，腾讯混元大模型广告效果超过Midjournry。”

在腾讯推出混元之前，2023年以来，科技巨头们已经开启了你追我赶的大模型竞赛。

国内最早发布大模型的巨头是百度。3月16日，百度宣布正式推出文心一言，并宣布开放测试邀请。百度创始人、董事长兼首席执行官李彦宏曾表示，模型本身是不直接产生价值的，基于基础大模型开发出来的应用才是模型存在的意义。对于创业者来说，“卷大模型没有意义，卷应用机会更大。”8月31日，百度大模型文心一言率先向全社会开放，应用商店搜索“文心一言”可直接下载。

而阿里巴巴在2023年4月紧随百度之后发布了大模型“通义千问”，阿里云随即升级其音频转写平台“听悟”，并配备AI驱动的会议分析能力；7月，阿里云推出生成式AI文生图模型“通义万相”；8月，阿里云通义千问70亿参数通用模型和对话模型，两款模型目前均开源、免费、可商用。

阿里巴巴集团董事会主席兼首席执行官张勇曾表示，今天做大模型的公司不少，在中国，往后无非是两条路，一条是像阿里，和云一起，基础模型是普惠的，让更多的开发者来使用；二是企业从基础模型入手，但对某些领域聚焦，这取决于相关企业在该领域数据的质量和规模。“我想会有一大批这样的企业，从大模型起家，而后进入特定领域。”

360创始人周鸿祎则说，不要神化大模型，“大模型最核心的能力是写作生成和知识问答，企业客户可以先在一个小切口场景把大模型用起来，再去跟自身业务做协同。”此前，“360智脑”大模型已面向公众开放。据360公布的2023年半年报数据显示，“360智脑”已经为360带来了近2000万元的相关业务收入。

值得关注的是，在同日举办的第二届外滩大会上，蚂蚁集团董事长兼CEO井贤栋表示，蚂蚁把科技作为最核心的竞争力，最重要的生产力，发展根本的驱动力，对大模型高度重视，全情投入。据他透露，蚂蚁将在9月8日发布的大模型，是全栈布局的、纯自研的。

从最初的算法和算力再到如今的应用场景，大模型的入局者越来越多，应用前景也逐渐贴近现实。据蓝鲸财经记者不完全统计，到目前为止，国内已经发布超130个大模型，“百模大战”已经开启，除了这些巨头之外，还有王小川创业的百川智能、“商量SenseChat”大模型的商汤科技、“星火认知”大模型的科大讯飞等多家公司加入战局。

THE END

中局大模型混元竞赛腾讯

免责声明：本文系转载，版权归原作者所有；旨在传递信息，不代表亚设网的观点和立场。