从金融到教育,腾讯云行业大模型走出一条差异化落地路径。
编者按:本文来自微信公众号 连线Insight(ID:lxinsight),作者:周雄飞 ,编辑:子夜,创业邦经授权转载,头图来源摄图网
过去半年,大模型在延续火热态势的同时,也在加速分化。
一个明显的特征是,除了通用大模型之外,业界对行业大模型的布局,也变得火热起来了。
7月6日-8日召开的2023世界人工智能大会上,腾讯研究院发布了《人机共生——大模型时代的十大AI趋势观察》报告,报告中有两点趋势尤其值得关注:
第一,未来将形成模型即服务的MaaS生态;
第二,行业应用是大模型的主战场。
报告指出,一方面,大模型为AI标准化、模块化、自动化的实现提供了路径,正在重构现有的商业模式;另一方面,在金融、零售、政府、制造、物流等多个行业及应用场景,生成式AI技术已经展现出了出色的能力,接下来各行各业都将迅速整合大模型的能力,创造出全新的商业价值。
结合这两点,不难发现,随着大模型产业从混沌走向成熟,其在产业场景的应用落地,将成为接下来业界的一个关键命题。
行业大模型热潮下,腾讯是布局行业大模型的最具代表性的一个玩家。
上个月,腾讯云已经公布了自己的方向——服务产业界,洞悉不同产业对大模型的需求,向更多产业场景的用户提供MaaS(Model as a service)服务。
在回答了做什么以后,现在腾讯云要回答怎么做的问题:
在具体深入产业的过程中,腾讯云如何按需提供大模型解决方案?
腾讯云的技术优势体现在哪里?凭什么为各个产业的用户“量体裁衣”?
目前落地的效果如何,是否达到客户预期?
也就是说,选择先做行业大模型这一路径后,腾讯云实际上完成了“面子”的整体搭建,这基于它布局大模型的思路,指导着腾讯云行业大模型的布局方向。
但比“面子”更重要的是“里子”,即在大方向确定下来之后,如何在接下来一步一步脚印,给出场景落地的最佳答案。毕竟,产业场景,才是大模型的最佳练兵场。
目前,中国大模型产业目前还处于发展初期,未形成稳定格局,不过,探索大模型技术的产业化应用,已经是行业的一大共识。
这一共识下,最近一段时间,越来越多的垂直行业大模型开始涌现。
比如毫未智行发布了自动驾驶生成式大模型DriveGPT、我爱我家联合第四范式推出了行业首个房产经纪大模型 1.0 版本、互联网医疗公司医联也发布了自研的医疗大预言模型MedGPT等等。
除了企业亲自下场,研发专属的行业大模型之外,还有一个玩家尤其值得关注。
腾讯云在6月份发布了行业大模型解决方案,其依托腾讯云TI平台打造了行业大模型精选商店,为客户提供MaaS(Model-as-a-Service)一站式服务,帮助客户构建专属大模型及智能应用。
腾讯云MaaS全景图,图源腾讯云公众号
简单来说,如果一家企业想要拥有自己的大模型,他们不必亲自下场做,而是可以依托腾讯云的行业大模型解决方案达成诉求。
据连线Insight了解,腾讯云TI平台内置了多个高质量行业大模型,涵盖了金融、传媒、文旅、政务、教育等多个行业场景,企业可以结合自身场景数据按需定制精调,也可以根据自身需求开展多模型训练任务。
不难发现,在做大模型这条路上,腾讯选择了一条有着明显差异化的路径:
它把重心放在了行业大模型上,试图在不同的场景中落地,它站在了产业互联网的视角,思路是要帮助更多的企业更方便、快捷、实惠地用上行业大模型。
在2023世界人工智能大会现场,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示,通用大模型有很强的能力,但并不能解决很多企业的具体问题。
“企业的大模型应用需要综合考虑行业专业性、数据安全、持续迭代和综合成本等因素。基于行业大模型,构建自己的专属模型,也许是企业更优的选项。”汤道生表示。
实际上,腾讯云是第一批下场做行业大模型的玩家、同时是最先打造行业大模型生态的玩家。
“大模型时代,开放是非常重要的一个特点。我们观察到,底层的技术变化太快,技术的外延能力也会非常广,大模型要结合到一个行业里面,要发挥最大的价值,只有开放,通过开放让行业专家等各类角色人员加入进来,才能让生态更加健康,产生更多可能性。”腾讯云副总裁、云智能负责人、优图实验室负责人吴运声提到。
这背后,是腾讯云对大模型以及产业互联网的深度思考。
一方面,腾讯云观察到,相比于通用大模型,行业大模型更加具象,可以贴近企业的实际需要。吴运声表示,大模型的技术跟腾讯在产业互联网多年的经验和数据结合之后,能够用跟以往不一样的方式,解决很多行业遇到的问题。
另一方面,腾讯云推出行业大模型,也与其以往的业务逻辑相关联。腾讯CSIG(云与智慧产业事业群)在产业互联网领域深耕多年,积累起了大量客户和行业knowhow,使得腾讯云在垂直行业打造行业大模型解决方案时,有着天然优势。
这条路径,同时与腾讯在推动B端企业数字化转型过程中秉承的“务实”理念一脉相承——即大模型需要深入到产业中去、需要在各行各业落地实践,才能发挥出最大的效用,并不断迭代及进化。
这也是为什么,腾讯云的行业大模型解决方案,其实就做了一件事:让更多的企业通过腾讯云,用更低的成本、更高效地加速大模型在更多产业场景的落地。
《人机共生——大模型时代的十大AI趋势观察》中提到,随着生成式人工智能技术的飞速发展,已经在多个领域催生出全新的商业价值。
一个现象是,在全球范围内,第一批跨功能的应用已经出现。比如金融行业的Stripe、Bloomberg;零售行业的可口可乐;生命科学领域的 Profluent、absci等,在这些落地中,生成式AI被应用到内容创建、知识发现、智能客服等场景。
在中国市场,这种趋势同样明显。以腾讯云为代表的一众厂商,已经在积极推动大模型在产业场景的落地。
在腾讯云的MaaS一站式服务下,企业可以从大模型精选商店中按需取用,可以在解决方案基础上加入独有的场景、数据,快速精调生成专属模型,还可以根据业务场景需求,按需定制不同参数、规格的模型。
与此同时,腾讯云TI平台提供完善的大模型平台和工具链,企业可以根据自身业务需要进行数据精调;腾讯云还提供本地化的训练、落地及陪跑优化服务。
在这一系列布局之下,腾讯云在无形中降低了普通客户使用大模型的门槛——正如腾讯云所希望的那样,大模型需要更懂行业、更易落地。
吴运声告诉我们,腾讯云希望在每个特定场景里面100%解决客户的问题,而不是找100个产品解决70%到80%的问题,因此会聚焦于找一些特定的行业,跟客户深入打磨,解决行业问题。
我们不妨来看看,腾讯云在金融行业的大模型,实际的落地表现如何。
相比其他行业,金融行业的数字化难度更大、场景更复杂。
一方面,金融行业是强监管行业,对安全性和可靠性要求极高;另一方面,金融业数字化场景和需求极其丰富、极其碎片化。
以票据处理场景为例,2017 年、2018 年前后,各大银行开始纷纷引入OCR模型,辅助人工,让银行票据处理效率得到了大幅提升,这也是腾讯云智能起初切入金融行业数字化时率先布局的场景。
不过随着时间推移,银行票据种类、版式多的特征愈发明显,银行对长尾场景偏复杂的识别需求也逐渐增多,这导致原来普通的OCR技术不够用了。尤其是由于票据版式不固定、样本量少、数据标注质量不佳、排版复杂,或者文档中含有手写体、多种语言、特殊字符等情况下,OCR的识别准确率开始大大降低。
解决这一问题的一种方式是,银行在前端继续投入人力进行录入和校验,在后端则增加开发人员,对新出现的版式重新配置模型。
但这种方式显然过于低效、且所耗费的在人力等方面的资源较重。
腾讯云的解法是,通过提升OCR模型的泛化能力,推出了多模态融合技术以及TI-OCR训练平台。
腾讯云TI平台产品特性,图源腾讯云官网
简单来说,腾讯云利用文本、图像和布局三个天然对齐的模态信息,在多模态文档预训练的基础上,进一步统一了文档结构化信息提取范式,形成了智能结构化基础模型,使得单一模型能够支持 5000 种以上版式。无论是银行单据、票证、凭证等,这一模型都能进行高精度信息提取。
而推出TI-OCR平台,则是腾讯云选择将能力开放,通过提供低门槛的训练工具,让客户自己也可以训练非标准化文档的OCR模型。
一家国家首批股份制商业银行,利用腾讯云TI-OCR大模型,最终实现了对各种格式数据的高精度识别,识别准确率高达95%以上。同时客户还减少了低价值高耗时的手工作业,节省了运营、人力成本,实现了多元业务数据处理的标准化、线上化、自动化。
同样值得注意的是,先切实解决某个行业的一个问题,再将沉淀下来的能力对外开放,是腾讯云智能的一条落地路线,比如除了TI-OCR平台之外,腾讯云智能还推出了针对工业质检场景的TI-AOI。
再来看另外一个案例,腾讯云TI平台能力在金融场景下的创新。
2016年以来,上海金融期货信息技术有限公司(以下简称:中金所技术公司)不断探索AI技术在结构化与非结构化数据中的应用实践,也产出了一定的学术成果。
但长达几年的时间里,这些研究始终缺乏一个统一落地的平台。这给客户带来了一定困扰。
比如无法实时获知算法服务的监控和资源占用情况,导致算法服务运维成本高,资源分配不合理;再比如,传统的开发模式下,算法框架重复构建,运行环境中的版本冲突等问题。
与此同时,由于AI开发的成果和资产分别需要集成至不同系统,因此带来了管理和复用的问题。
2020年底,中金所技术公司开始引入腾讯云TI平台。其相关负责人告诉连线Insight,目前他们使用最多的模块有两个。
腾讯云TI平台泛互联网客户TI解决方案,图源腾讯云官网
第一个是训练工坊,也就是训练模型的。
在腾讯云TI平台,通过训练工坊,可以使用任务式建模构建模型,以向导式的训练任务提交方式进行模型构建,支持基于多种算法来源进行训练任务提交,同时还可以直接通过代码包绑定主流训练框架启动训练任务,也可以快速使用主流高性能及分布式训练框架提交训练任务。
在这一过程中,由于平台内置了通用算法框架和上百算子,在某种程度上降低了企业算法框架的搭建成本和人力投入。同时,可视化建模的方式,也减少了开发基础算子的时间和编码工作量,加速了模型开发及训练过程。
第二个是模型服务功能,是用于对外服务的。
腾讯云TI平台同时支持客户发布和调用模型。简单来说,客户可以将第三方模型导入平台,并部署在线服务,也可以将平台训练出来的模型部署为在线服务。
中金所技术公司由于业务需要,主要将自己开发的算法导入到平台,紧接着以服务化的方式提供给其他部门使用,提供restful服务。
这位负责人告诉我们,在这一过程中,他们与腾讯云紧密合作实现了平台的定制化功能,从而使平台可以支持灵活的基础环境拓展及自定义,实现了算法框架的持续更新迭代。
值得注意的是,平台除了支持基于客户本身开发的模型之外,还纳管了上线前的OCR、ASR、TTS等模型和算子,从而实现了AI资产的统一管理,提升了开发效率和资源复用。
最后,在实际应用中,腾讯云TI平台已成功支持了包括中金所及技术公司内部的智慧屏和三大平台系统,每日调用峰值高达 1 亿次,整体调用成功率超过了 99%。
除了推动行业大模型在金融行业加速落地外,在文旅、媒体、教育、政务等多个垂直赛道,腾讯云行业大模型也在加速落地。
比如央视基于腾讯云智能媒体AI中台,部署了TI平台原生模型服务,打造人工智能开放平台,通过引入自研“标签权重引擎”,让内容标签的颗粒度更细、理解度更深、泛化性更高。
腾讯云行业大模型不断落地背后,有两个不容忽视的关键要素。
第一个要素是技术。
腾讯云打造的模型精选商店,基于大模型高性能计算集群和大模型能力,依托的则是腾讯云TI平台。
当前,腾讯云TI平台集合了AI应用服务平台TI-Matrix、机器学习平台TI-ONE、数据标注平台TI-DataTruth,各平台功能模块可以解耦按需交付部署,持续降低构建、应用AI能力的成本。
在此基础上,腾讯云TI平台可以打通从数据获取、数据处理、算法构建、模型训练、模型评估、模型部署、到AI应用开发的全流程。
最近,腾讯云还正式发布了新一代HCC高性能计算集群,采用腾讯云星星海自研服务器,为大模型训练、自动驾驶、科学计算等提供高性能、高带宽和低延迟的集群算力。数据显示,腾讯云新一代集群的算力性能较前代提升了 3倍,是当前国内性能最强的大模型计算集群。
与此同时,7月4日,腾讯云正式发布了AI原生向量数据库,能够被广泛应用于大模型的训练、推理和知识库补充等场景,也是国内首个从接入层、计算层、到存储层提供全生命周期AI化的向量数据库。
不难发现,腾讯云在这些基础设施侧的技术累积,是支撑其行业大模型加速落地的一大关键。
第二个要素是赋能TO B的经验。
行业大模型要想真正做到赋能、改造甚至颠覆行业,一个必要的前提在于,需要对技术应用场景、业务等有深刻的认识,对特定行业的痛点有深刻理解。
在这一层面,腾讯自“930变革”后加速向产业互联网转型,至今已经积累起了丰富的产业数字化赋能经验,并持续深化“务实”这一思路。
“在内部,我们团队不断增加协同性、行业 know-how,以前金融、传媒的架构师从只售卖AI产品,后来他们会主动了解客户的痛点,不断适配相应的产品解决方案。”吴运声如此表示。
可以预见的是,随着大模型深入产业的热潮持续下去,以及MaaS化带来的新一轮商业模式变革下,TO B领域也将进入新的竞争阶段。
在这一趋势下,腾讯率先推动行业大模型,无疑是一个正确的决定。而在大模型落地、赋能各行各业的过程中,又会反过来对腾讯云的自身能力产生正反馈,形成飞轮效应。