每经记者 可杨 每经编辑 张海妮
2月4日晚间,北京2022年冬奥会开幕式在国家体育场“鸟巢”举行。本届冬奥会期间,虚拟数字人是重要技术之一,中央广播电视总台新增了央视新闻AI手语虚拟主播,报道冬奥会新闻、准确及时地进行赛事手语直播。据悉,这名虚拟数字人主播是由“百度智能云曦灵”数字人平台打造的首个AI手语主播。
虚拟数字人背后,涉及计算机图形学、图形渲染、动作捕捉、深度学习、语音合成等多种技术。随着2021年元宇宙概念持续火热,虚拟数字人也作为元宇宙的场景入口和连接纽带而备受瞩目,而冬奥会上的虚拟数字人元素,也将让大众进一步认识这项技术。
不过,虚拟数字人要实现大规模商业化,仍有难题待解。百度智能云AI人机交互实验室负责人李士岩介绍,目前数字人尚未实现规模化产业落地,主要原因在于数字人制作技术门槛高、周期长、成本高。
AI助力听障人士观冬奥
据百度提供的数据,全球约有4.3亿人患中度及以上听力障碍,根据全国第二次残疾人抽样调查数据,中国有听障人士2780万。而在本次冬奥赛事中,AI手语数字人将成为他们观赛的重要桥梁。
百度方面介绍,区别于传统翻译,手语翻译的难点在于:手语并非按照语言逐字翻译,而需要根据语句整体意思进行语言精炼和语序调整,同时还需实时配合表情和唇语,帮助听障者更好地理解。这就导致AI手语数字人在信息凝练度、低时延和精细化三方面面临极其复杂的技术难题。因此,AI手语主播不仅需要具备高精度的数字人形象,还需要具备能够语音识别、手语翻译和手语表达的AI大脑。
据悉,百度智能云目前建立了规模庞大的手语动作库,基于《国家通用手语词典》规范,结合动作捕捉设备和真实手语老师的双向调优,精修近1万个手语动作,保证了手语表达的动作准确性。同时,通过4D扫描技术,让AI手语主播口型生成准确度达到98.5%。
而虚拟手语主播的“AI大脑”则依托于百度智能云。通过百度自主研发的机器翻译技术,百度智能云构建出了一套精确的手语翻译引擎,可懂度达到85%以上,结合百度自研的语音识别技术,可将冰雪赛事的文字及音视频内容,快速精准地转化为手语;同时再通过专为手语优化的自然动作引擎,完成AI手语主播的动作驱动,实时演绎为数字人的动作、表情和唇语。据百度方面介绍,这一虚拟数字人研发工作,耗时不到2个月。
虚拟数字人技术为何能在此次冬奥会期间成为重要技术之一,易观分析互娱行业高级分析师王媛娅认为,中国很多领域在新技术应用方面很超前,具有很强的创新意识。在本届冬奥会上,虚拟数字人是为观众带来极致体验的重要方式之一,随着虚拟数字人在这几年受到越来越多的关注,通过虚拟数字人来展示内容已变得越来越常见。虚拟数字人不仅能在疫情期间控制现场演员数量,更能够用科技演绎艺术,为观众带来更新颖更多元的表演。
她同时表示,冬奥会开幕式是让大众了解虚拟数字人价值的契机。目前很多厂商正在布局或者计划布局虚拟数字人赛道,由于虚拟数字人是基于3D、VR、动作捕捉等一些技术实现的,随着科技的进步、市场需求的增加和冬奥会的助推,虚拟数字人会越来越成熟,进一步进入大众视野。除了直播带货和演出,虚拟数字人会在更多领域得到商业化机会。
商业化仍有难题待解
据元透社发布的《虚拟数字人深度产业报告》,预计2030年,我国虚拟数字人整体市场规模将达到2700亿元,而目前市场仍处于前期培养阶段。
王媛娅认为,目前国内虚拟数字人刚刚从探索期过渡到成长期,成为元宇宙生态中快速发展的赛道。最近几年,虚拟数字人的应用领域逐渐拓宽,功能属性加强,已不再是二次元专属,比如现在已经有了虚拟KOL、虚拟主持人、虚拟客服等很多角色,商业价值也在直播带货场景中得到了验证。以“初音未来”为代表的海外头部虚拟数字人在探索期已建立全球影响力。同时,一些国外头部厂商开始关注虚拟数字人在B端的应用,并且已经推出了一些服务于B端市场的产品。
百度智能云AI人机交互实验室负责人李士岩介绍,目前数字人尚未实现规模化产业落地,主要原因在于数字人制作技术门槛高、周期长、成本高。打造一个高精度、高保真的非特异型虚拟数字人,动辄就需要百万甚至上千万的资金投入。
李士岩表示,虚拟数字人产业格局中,提供建模、渲染、动态捕捉等服务于数字人制作的基础设施服务商已形成稳固格局,大多由海外巨头把持。但在工具、应用层,中国企业已开始崭露头角。
不过,数字人规模化落地还面临三大难点:产业链割裂、服务场景与演艺场景没有有效打通、满足高频需求成本高。
对于虚拟数字人大规模商业化所面临的难题,王媛娅认为,市场对虚拟数字人的关注度会持续上升,也会有越来越多的企业投入打造虚拟数字人。但是懂技术、懂美术、又懂偶像运营的公司太少,所以未来需要产业链各方企业合作联合推出虚拟数字人,或者大型公司联合多个业务部门推出。
对于虚拟数字人未来的发展,李士岩表示,数字人产业有三大核心推动力:第一级是用户需求与技术升级,第二级是政策支持与资本涌入,第三级是计算平台的迭代。每一次数字人发展本质上都是技术推动的,用户从平面的图文影音获取信息与交互,向实时3D交互反馈的需求转变。
百度集团副总裁吴甜则表示:“百度已发布集数字人生产、内容创作、业务配置服务为一体的智能数字人平台百度智能云曦灵,希望通过全栈AI能力,把虚拟数字人的生产周期缩短到小时级别,降低生产成本,并且用AI驱动生成内容。”
(李显杰 )