大模型竞赛棋至中局,腾讯“混元”加入战场

观点
2023
09/07
20:31
亚设网
分享

大模型竞赛棋至中局,腾讯“混元”加入战场

图片来源:视觉中国

中国市值最高的互联网巨头腾讯,在科技界的期待与压力之下,终于向公众披露了其通用大模型进展。

9月7日,在2023年腾讯全球数字生态大会上,腾讯混元大模型正式对外公布。据腾讯介绍,腾讯混元大模型拥有超千亿参数规模,预训练语料超2万亿tokens,具有强大的中文理解与创作能力、逻辑推理能力,以及可靠的任务执行能力。

此外,腾讯还表示,混元大模型已经接入腾讯50多项业务并取得初步效果,包括腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等业务和产品。

据腾讯称,混元大模型将作为腾讯云MaaS(Model-as-a-Service,模型即服务)服务的底座,企业用户不仅可以直接调用混元,也可以将混元大模型作为基底模型,为不同产业场景构建专属应用。

在大模型竞赛风起云涌的上半场,腾讯的动作并不算快。“我们最开始以为这是互联网十年不遇的机会,但是越想越觉得这是几百年不遇的、类似发明电的工业革命一样的机遇。AI非常重要,但这的确需要有很多的积累。”腾讯CEO马化腾于今年5月股东大会上的这句话,解释了腾讯的行动逻辑,他认为,对于工业革命来讲,早一个月把电灯泡拿出来在长的时间跨度上来看是不那么重要。

腾讯称,早在2020年,腾讯就开始研发混元,今年8月,混元已经进入公司内应用测试阶段,但一直没有披露最终进展。

在大会上,腾讯集团副总裁蒋杰表示,“在文档处理方面,混元优于国内某大模型,采纳率高出6倍,在Excel公式的准确性,也远远超过GPT 3.5;在广告业务场景方面,腾讯混元大模型广告效果超过Midjournry。”

在腾讯推出混元之前,2023年以来,科技巨头们已经开启了你追我赶的大模型竞赛。

国内最早发布大模型的巨头是百度。3月16日,百度宣布正式推出文心一言,并宣布开放测试邀请。百度创始人、董事长兼首席执行官李彦宏曾表示,模型本身是不直接产生价值的,基于基础大模型开发出来的应用才是模型存在的意义。对于创业者来说,“卷大模型没有意义,卷应用机会更大。”8月31日,百度大模型文心一言率先向全社会开放,应用商店搜索“文心一言”可直接下载。

而阿里巴巴在2023年4月紧随百度之后发布了大模型“通义千问”,阿里云随即升级其音频转写平台“听悟”,并配备AI驱动的会议分析能力;7月,阿里云推出生成式AI文生图模型“通义万相”;8月,阿里云通义千问70亿参数通用模型和对话模型,两款模型目前均开源、免费、可商用。

阿里巴巴集团董事会主席兼首席执行官张勇曾表示,今天做大模型的公司不少,在中国,往后无非是两条路,一条是像阿里,和云一起,基础模型是普惠的,让更多的开发者来使用;二是企业从基础模型入手,但对某些领域聚焦,这取决于相关企业在该领域数据的质量和规模。“我想会有一大批这样的企业,从大模型起家,而后进入特定领域。”

360创始人周鸿祎则说,不要神化大模型,“大模型最核心的能力是写作生成和知识问答,企业客户可以先在一个小切口场景把大模型用起来,再去跟自身业务做协同。”此前,“360智脑”大模型已面向公众开放。据360公布的2023年半年报数据显示,“360智脑”已经为360带来了近2000万元的相关业务收入。

值得关注的是,在同日举办的第二届外滩大会上,蚂蚁集团董事长兼CEO井贤栋表示,蚂蚁把科技作为最核心的竞争力,最重要的生产力,发展根本的驱动力,对大模型高度重视,全情投入。据他透露,蚂蚁将在9月8日发布的大模型,是全栈布局的、纯自研的。

从最初的算法和算力再到如今的应用场景,大模型的入局者越来越多,应用前景也逐渐贴近现实。据蓝鲸财经记者不完全统计,到目前为止,国内已经发布超130个大模型,“百模大战”已经开启,除了这些巨头之外,还有王小川创业的百川智能、“商量SenseChat”大模型的商汤科技、“星火认知”大模型的科大讯飞等多家公司加入战局。

THE END
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表亚设网的观点和立场。

2.jpg

关于我们

微信扫一扫,加关注

Top