紫金财经7月19日消息 近日IT市场研究和咨询公司IDC最新发布的《AI大模型技术能力评估报告,2023》显示,百度文心大模型3.5拿下12项指标的7个满分,综合评分第一,算法模型第一,行业覆盖第一,三个绝对第一体现了百度文心大模型的基础技术深度和产业应用覆盖广度。
IDC报告围绕三个维度进行评估
IDC评估报告围绕产品技术、服务生态以及行业应用三大维度,考察大模型的10余项指标,其中“算法模型”和“行业覆盖”成为衡量大模型能力极其重要的两个指标。
其中,“算法模型”维度是重中之重,是大模型能力最为核心的要素,也是决定大模型应用效果的根本所在。只有通过算法模型技术的突破,实现具有通用效果优势的大模型底座,才能支撑更广泛的行业覆盖,才能使各行各业充分享受技术突破带来的红利,破解AI落地门槛高的困境。
在行业应用能力中,应用覆盖的广度是当下大模型厂商最为关注的指标。“行业覆盖”通过企业级客户数量和落地行业数,体现了大模型在产业落地上的实力,是大模型效果通用领先性、行业结合能力两方面的综合体现。
文心大模型成为算法模型维度唯一满分
IDC首次提出AI大模型技术能力评估框架,国内主流大模型,包括百度、阿里、腾讯、华为、科大讯飞、360、商汤等14家厂商参与了本次评估。结果显示,百度AI大模型整体竞争力位于领先水平,是这场大模型技术突破者和应用引领者。百度文心在模型能力、工具平台、生态布局以及行业覆盖上优势明显,并已提前进入商业化落地探索阶段。
具体来看,文心大模型在此次IDC评估中获得了算法模型维度的唯一一个满分,充分体现了百度在大模型核心技术上的领先优势。百度自2019年开始深耕预训练模型研发,先后发布知识增强文心系列模型。前不久,百度正式发布文心大模型3.5版本,进一步在基础模型、知识增强、检索增强等多项核心技术上取得创新,新版本在各项能力上均有明显提升。
据报道,百度拥有自研的深度学习平台飞桨有力支撑了大模型的高效训练和推理。飞桨与文心的协同优化,让文心大模型3.5最新版本的模型效果提升50%,训练速度提升2倍,推理速度提升30倍。知识增强作为文心大模型的核心特色之一,实现了更高的效率、更好的效果、更强的可解释性。
百度文心形成三位一体的生态体系
在大模型生态方面,百度文心已形成企业、教育、社区三位一体的生态体系。最新数据显示,百度有超过750万开发者基础,20万企业生态基础,多层次开展大模型人才培训、企业赋能、开发者运营。百度还设立了10亿创投基金鼓励大模型创意、繁荣大模型生态。
IDC评估结果显示,百度文心大模型在行业覆盖上获得唯一满分成绩,在能源、金融、教育、医疗等领域已经实现广泛业务布局和落地场景探索。
据介绍,文心大模型已经拥有中国最大的产业应用规模,目前有15万家企业申请接入文心一言测试。百度智能云与300多家生态伙伴,在超过400个场景中已取得相当不错的测试效果。
以能源电力为例,在全球最大的公用事业企业——国家电网有限公司,面向复杂电网的专业场景,基于百度文心大模型,百度与智研院联合训练电力行业大模型,在电网设备、客服等实际业务场景进行试点验证,可以显著增强电网运营的精细化、自动化、智能化水平。