北京时间,一年一度的百度研究院顾问委员会会议圆满落幕。一向低调神秘的百度研究院,公布了一份亮眼的成绩单:最近一年,百度研究院在国际顶会和期刊上累计发表270多篇论文,夺得40多项国际权威竞赛冠军,获得30多项国内外奖项,在深度学习、视觉、生物计算、量子计算、机器人、安全等多个领域的前瞻技术研发和落地探索上,取得了丰硕成果。
前瞻技术全面突破 领跑全球
(百度研究院召开顾问委员会线上会议)
在前瞻技术方面,百度研究院在生物计算、量子计算、自然语言处理、隐私安全计算等领域取得持续突破,均处于世界领先水平。
新冠疫情期间,mRNA作为一种新型的疫苗类型,具有可大规模快速生产的优势,成为这场疫情保卫战的重要武器之一,但科学家难以通过传统算法在紧急时刻内找到最稳定的序列。
2020年4月,百度研究院正式推出LinearDesign算法。相较于传统的密码子优化设计方法,LinearDesign能大大提升mRNA疫苗序列的稳定性和蛋白质表达水平,以及疫苗的抗体滴度(即保护力)。针对新冠病毒刺突蛋白mRNA疫苗,LinearDesign可在10分钟以内寻找到稳定的序列设计,并在抗体滴度上,比通用的密码子优化序列有大幅度提升。也就是说,在同等条件下,采用百度算法设计的新冠疫苗,可以大大提升保护力。
LinearDesign不仅能用于新冠 mRNA 疫苗的研发,还能用于流感疫苗、肿瘤疫苗等多种疫苗,甚至包括抗体和药物的研发。真正将药物发现的“大海捞针”变成“按图索骥”,为人类的生命健康谋福祉。
在量子计算领域,百度研究院完成了以量脉、量桨、量易伏三大项目为主体的百度量子平台的数次重磅升级。其中量易伏成为国内首个接入量子计算真机的云原生量子计算平台。百度量子平台提供了连接顶层解决方案和底层硬件基础所需的大量软件工具以及接口,希望其成为“量子计算时代操作系统”。
在各项核心技术产出上,百度量子持续保持着国际领先地位,并正在发掘量子计算对AI科技的更多加持。量子人工智能在算法、框架、硬件三个层面进行AI基础能力的创新突破,预计能在准确率提升的同时大幅降低时间和能源成本。
在AI+工业领域,计算机视觉和深度学习等技术的进步,让工程机械也出现了“无人化”趋势。百度研究院打造了全球首个实际落地的、可长时间作业的无人挖掘机作业系统(AES),并被国际顶级期刊《Science》子刊 《Science Robotics》刊发相关技术成果。
AES融合了感知、运动规划和控制系统,可在没有任何人工干预的情况下工作,通过准确和实时的算法来自主感知环境、规划路线和控制机械。借助该系统打造的无人挖掘机不仅可以更好地适应塌方或有毒等恶劣的作业环境,降低人身安全危险;同时也能实现更长时间的不间断作业,提升工作效率。目前,AES已经落地工业废料处理相关领域,实现了工业废料连续24小时自动上料功能,助力工业废料处理产线实现全程的无人化处理。
(AES实战场景)
在视觉领域,百度研究院基于飞桨深度学习平台打造并发布了一个视觉Transformer&MLP算法开发及实验平台——PaddleViT,为业界提供了最前沿的4个视觉任务模型。在以人为中心的视觉分析方面,提出了一系列包括人脸年龄估计、人脸防伪、人脸表情识别、人脸伪造检测等算法,并出版一本关于活体检测的技术著作《Multi-modal Face Presentation Attack Detection》(《多模态人脸防伪检测》),该著作也被国际知名出版社Morgan & Claypool Publishers收录到其计算机视觉领域的系列丛书中。
人工智能技术特别是深度学习及其应用飞速发展,但深度学习的“黑盒”特性使其缺乏足够的可解释性,也降低了对特定领域的深度学习和人工智能的信任感。百度研究院开发了基于飞桨的可解释性算法开源库InterpretDL,目前已集成了十余种主流的可解释性算法,并遵循“Plug-and-Play”的设计理念,用户无需修改模型;所有算法使用统一API接口,方便用户快速上手;对每种算法提供单独的教程与解析,帮助用户理解、选择合适的算法,在多个领域都有明显的性能提升。
百度研究院还打造了业界首个针对机密计算的形式化验证工具SGXRay,协助厂商修复多个高危漏洞。并建立全球首个支持多硬件平台的、安全性最高的开源机密计算框架Teaclave,可提供RUST SDK,支持内存安全的可信应用开发。
在基础理论研究方面,百度研究院从理论、算法、硬件、应用方面构建了完整的分布式机器学习和联邦学习系统框架;在加速机器学习方面,百度研究院提出了包括近邻检索、哈希算法、模型压缩等一系列优化算法,并实现在百度深度学习框架飞桨当中。同时,百度研究院还持续研究深度学习和知识图谱Embedding构建、深度学习模型安全和攻击、深度生成模型包括GAN,EBM,VAE等;累计数十篇包括机器学习、深度学习基础理论的论文,在Journal of Machine Learning Research, IEEE Transactions of Information Theory, Conference on Learning Theory, NeurIPS 等顶级期刊和会议中发表,并获得NIPS 最佳论文奖和SIGIR 最佳短文荣誉提名奖等多个奖项。
应用落地遍地开花 赋能千行百业
百度研究院对技术的前瞻视野不仅体现在研发突破上,也融入在前沿技术的产业级落地探索上。
跳水运动作为一项超高速运动,从起跳到落水只有2秒钟时间,动作捕捉和回溯是长期以来的难点,百度研究院基于“3D+AI”技术,首次实现“云-边-端”软硬一体的AI辅助训练系统,通过AI技术对训练视频进行摘要、动作抽取、姿势纠正等处理,快速进行归纳整理,突破了体育运动定量评价与数据分析的难题,将竞技体育更精细化定格在时间和空间维度,让体育训练更加科学、智能、合理、有效,实现了“看得清”“看得准”“看得全”“看得懂”四大核心能力。
(“3D+AI”跳水辅助训练系统)
同传对于人类来说是一项很有挑战性的任务,因为人类同传译员需要同时做到听、理解、翻译并说出翻译内容。人类一般只能持续15分钟的高质量同传,且译出率一般都在60%左右,漏翻,错翻等情况时常发生。作为AI同传技术的领军者,百度AI同传首次做到了直接从语音到文字的同传翻译,该模型达到了更低的时延和更准确的翻译,彻底摒除了ASR错误对翻译模型的影响,进一步简化了整体同传框架。
如今,移动视频已经成为移动互联网使用最重要的三大应用类型之一。百度研究院于2020年推出了业界首个支撑通用型、大规模生产的智能视频合成平台VidPress影燃,可以低成本、大批量、高质量的将图文内容智能转化为带有配音配乐和画面的视频内容,将中、短视频采编创作的门槛降到最低。2021年,VidPress影燃携手秒懂百科,智能生成并发布了超过800条足球球员球队的介绍视频、精彩进球瞬间和慢动作回放视频。并作为百度大脑中“图文转视频”功能算子,助力人民日报将图文稿件智能转化为快讯短视频分发到不同平台,用低成本创造高品质内容。该能力还落地百家号,赋能图文作者低?槛转型为视频内容发布者。
在城市运营方面,基于大数据和人工智能技术,百度研究院也研发了支撑“数字城市运营”关键AI技术的“城立方”平台,包含了自动化城市大数据报告系统、卡口过车数据轨迹还原系统等模块。该系统已经部署在百度智能交通产品上,使交管决策有依据、算法可校验,让城市交通运营商模式行健致远。
学术研究和外部合作双驾马车 打造核心硬实力
作为百度旗下聚焦于人工智能前瞻基础研究、探索技术前沿方向的高端科研团队,百度研究院现已拥有认知计算实验室、硅谷人工智能实验室、深度学习实验室、大数据实验室、商业智能实验室、量子计算研究所、机器人与自动驾驶实验室、安全实验室、生物计算实验室九大实验室/研究所,研究领域几乎囊括了从底层基础到感知、认知技术的AI全领域范畴。数十位世界级顶尖专家学者汇聚于此,着力推动技术研发和布道。
百度CTO、百度研究院院长王海峰多次谈及百度研究院的战略:持续硬核技术创新,产生高影响力的研究成果并驱动实际应用。
基于这一理念,百度研究院也一直走在技术突破与落地应用的最前端,并不遗余力地推动技术的交流合作。近两年,百度研究院牵头举办了60余场学术研讨会,与产学研界广泛开展交流合作。在安全领域创办了以“自动驾驶安全”为主题的CTF比赛活动,并举办了面向全球的自动驾驶CTF比赛,推动AI感知与自动驾驶安全竞赛及社区建设。
无论在前瞻研究还是应用探索,百度研究院不断攀登新的高峰。当下,新技术正爆发出引领新一轮变革的强大推动力,百度也在持续追寻前沿科技的星辰大海。
(董云龙 )