7月21日,2022百度世界大会“AI深耕,万物生长”在线上召开,并在元宇宙希壤同步。现场公布了百度在智能云、自动驾驶、预训练大模型(简称“大模型”)等领域的最新动作。数字人希加加还在现场展示了作画等AIGC(AIGeneratedContent)能力。
事实上,无论是数字人、智能信控,还是自动驾驶,其背后都是百度AI技术在支撑。比如数字人之所以能画画,是凭借文心大模型—跨模态图文生成模型ERNIE-ViLG支持。使用这个模型,数字人不仅可以根据个性化需求自动生成油画、中国画等多种风格的图像,还能实现“看图说话”的效果。
会上,百度披露在预训练大模型领域的又一进展,携手中国航天重磅发布“航天-百度·文心大模型”,推进航天领域AI技术应用。
大模型或将
成下一代AI基础平台
作为当前人工智能发展的重要方向,预训练大模型已成为AI领域的技术新高地。
萨摩耶云科技集团首席经济学家郑磊告诉记者,大模型采用海量的一般性数据,在不进行标注的背景下,用于大规模的机器预学习。“大模型就像做‘毛胚件’,做好‘毛胚’后再精加工,可以较快地获得适应各种用途的模型。这是一种系统性的机器学习开发策略,对于一些较复杂和多样化的商业场景,这种方式效率更高。”
中国信通院发布的《人工智能基础设施发展态势报告》(简称“《报告》”)显示,当前,超大规模预训练模型在内容创意生成、语言/风格转换、对话等领域的落地进展较快。随着未来模型性能的不断提升及其平台的不断完善,大模型或将成为下一代AI基础平台,并赋能各行各业。
根据《报告》,我国超大规模预训练模型进展迅速,主要体现在两方面:一是头部企业自研大模型体量达千亿级参数规模;二是效率不断提升,商业化场景日益丰富。过去10年中,用于人工智能训练模型的计算资源激增,AI训练的计算复杂度每年增长10倍。
业内普遍认为,深度学习兴起的10年来,针对特定应用场景的小模型遇到瓶颈,因此大模型的出现被认为是人工智能领域的一个里程碑式突破,代表了算法在处理各种任务时使用人类语言推理的能力上的一次重大飞跃,能够显著解决小模型遇到的各种问题,泛化能力强、可以做到举一反三,是探索通用人工智能路径之一。科技巨头、科研机构等纷纷加大投入“炼大模型”,已成人工智能算法发展趋势和竞争焦点。
2021年,谷歌、华为、浪潮、阿里及百度先后发布了超大规模预训练模型,其中,百度联合鹏城实验室推出全球首个知识增强千亿大模型“鹏城-百度文心”,模型参数规模达到2600亿。该模型通过百度飞桨平台陆续对外开源开放,并已大规模应用于工业、能源、金融等行业。
航天大模型助力
深空技术创新与发展
2022年是百度文心大模型产业落地的关键年。5月份,百度一口气发布10个大模型。当时,百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜曾表示,支撑大模型产业落地有3个关键路径:建设更适配场景需求的大模型体系,提供全流程支持应用落地的工具、平台和方法,建设激发创新的开放生态。
百度CTO王海峰介绍,作为世界上首个航天领域大模型,航天-百度·文心大模型可以将航天领域的数据和知识融合学习,对航天数据进行智能的采集、分析和理解,助力深空智能感知、规划和控制等技术突破。
大模型落地的背后,是飞桨、文心大模型等底层AI技术能力的支持。飞桨是中国自主研发、功能丰富、开源开放的产业级深度学习平台,相当于“智能时代的操作系统”。文心大模型是飞桨模型库的重要组成部分,包含基础大模型、任务大模型、行业大模型等产业级知识增强大模型体系。
据悉,飞桨已凝聚477万开发者,创造56万个模型,服务18万企事业单位。
(文章来源:证券日报)
文章来源:证券日报