金磊 梦晨 发自 凹非寺
量子位 报道 | 公众号 QbitAI李彦宏手指按启动键,宇宙飞船便“嗖”的一下直插云霄、冲出大气层:
他还抽空在“中国空间站”内挥手向地面的朋友们打招呼:
难道百度给李彦宏拍了个CG电影了?
非也,非也。
上面所展示的这一切,正是在刚刚结束的百度Create AI开发者大会中所上演的一幕又一幕。
没错,百度第一次把大会搬进了元宇宙,而且是10万人在线的那种。
而画面中的李彦宏,是他的高精数字人;所乘坐的宇宙飞船,则叫做“萝卜快飞”。
随后,飞船便载着数字人李彦宏穿过纵向通道,将其送达大会的舞台。
不过,满满“元宇宙”味道的这场大会,承载的还是AI。
在现场,李彦宏一次又一次地从“AI工具箱”中展示一件件利器:
飞桨:首个国产产业级深度学习平台,相当于智能时代下的操作系统。
文心:百度全新的大模型品牌,海纳知识与数据,可像人类一样多方位感知理解世界。
生物计算-蛋白设计:从30分钟到5分钟,百度的生态公司百图生科,大幅缩减典型蛋白质结构预测时间。
除此之外,百度在此次元宇宙的场景中,同样也展示了自动驾驶、芯片、百度大脑等“传统节目”。
老样子,我们再次来一文看尽百度Create AI开发者大会。
5年内告别限购限行,10年解决交通拥堵
自动驾驶,这个集AI技术大成者,百度现在“玩”得怎么样了?
对此,李彦宏先是讲述了一段真实故事。
在北京亦庄的Apollo自动驾驶实验基地,百度的自动驾驶迎来了一批盲人学校的孩子。
孩子们惊喜又好奇地触摸着无人车的激光雷达、车内屏幕,当然,也乘着它体验了一段行程:
希望以后的车都能实现无人驾驶,这样视力有障碍的人,就可以和普通人一样出行了。
讲真,这确实是一个有温度的科技故事,但百度在自动驾驶方面要做的事远不止于此。
在李彦宏看来,智能交通将是解决当下诸多交通问题的最优解,也将是影响未来10-40年的重大变革。
而百度要构建的智能交通,是从自动驾驶出发,也是基于聪明的车、智慧的路的智能交通。
除此之外,在技术角度也要把AI、5G通信和云计算等深度融入于此。
那么具体而言,百度眼中的智能交通又将带来怎样的改变?
李彦宏在现场立下了三大flag。
首先,智能交通将减少90%的道路安全事故。
据了解,全球每年135万人在交通事故中丧生,相当于每24秒便有人因此失去生命。
而94%的交通事故的因素,是出自诸如注意力不集中、误判、酒驾和疲劳等。
李彦宏认为,“自动驾驶将消除人为因素,随着技术成熟,自动驾驶会比人类司
机更安全。”
其次,智能交通将系统解决拥堵问题。
未来的城市交通系统中,要有的不仅仅是“聪明的车”,道路也需得变得更加具备“智慧”。
对于这一点,百度已经有所行动和部署。
在现在的亦庄,有300多个路口安装了AIR智能交通系统,它和百度的Apollo在技术上拥有同源的感知、决策和控制能力。
例如摄像头、激光雷达和毫米波雷达,能让系统对道路无死角观察。
基于百度的昆仑芯片、Apollo和飞桨,则可以让智能道路系统的“大脑”更具智慧。
一个形象的比喻就是,AIR智能交通系统,相当于路端的“自动驾驶”。
正所谓“实践是检验真理的唯一标准”,李彦宏对AIR智能交通系统目前已取得成绩也做了介绍:
在河北保定核心区,过去两年年均机动车增长 7%, 但拥堵指数却通过部分路段信控优化下降了 6%。
在广州黄埔区,每辆车遇到红灯的平均次数,从三四次下降为 1 次左右。
而放眼更远的未来,李彦宏做出了这样的“预判”:
5年之内中国的一线城市将不再需要限购和限行;10年之内,基本上拥堵问题就可以解决。
第三,自动驾驶和智能交通可以助力碳减排。
绿色低碳,向来是技术发展的主旋律,百度在此发力的方式则是车、路、行三个方向。
例如在今年8月推出的“萝卜快跑”自动驾驶出行服务平台,一个季度便提供了11.5万次的服务。
这样的业绩也让其顺利成为全球最大的自动驾驶出行服务提供商。
李彦宏表示,萝卜快跑的服务将在2025年扩展到65个城市;2030年扩展到100个城市。
除了3个flag之外,汽车机器人也成为了百度在自动驾驶方面的焦点。
早在今年3月,百度成立了独立的智能电动汽车制造公司集度。
而在成立仅207天之后,集度便进入到了SIMUCar(软件集成模拟样车)的开发阶段,这种速度在行业中创下了纪录。
纵观李彦宏对汽车机器人的介绍,可以总结为三个理念:
拥有L4级自动驾驶能力
车与人能够自然交流
可以自我学习的迭代
而对于集度接下来对汽车机器人的计划,李彦宏表示:
2022年上半年集度将公布首款概念车,并在2023年量产交付首款汽车机器人!
最新核心技术突破:知识增强大模型
本场大会中,“真假李彦宏”无疑成为了一道非常亮眼的风景线。
在这方面,百度近几年可谓是动作不断,前后晒出了撒贝宁、龚俊等一系列数字人。
今天,百度数字人家族又迎来了一位新成员——AI 手语主播。
那她将来会去哪里“上岗”呢?
在AI手语主播的展示,她这样介绍到:
我为听障朋友们提供手语服务。
而百度数字人大家族的其它成员,其实早已深入各行各业,还是24小时无休的在提供着服务。
也正是基于如此的现状,百度首席技术官王海峰在今天宣布:
正式推出数字人平台——百度智能云曦灵,为大家提供多种数字人生成和内容生产服务。
但其实,百度数字人只是能力的一种表象,在其背后,实则是一个聪明的模型在发力。
这便是百度核心技术的新突破——知识增强大模型“文心”。
近几年来,大模型可谓是在全球范围内呈现出崛起式增长,而“文心”与众不同之处,在于它结合了百度10年来积累研发、包含5500亿知识的大规模知识图谱。
其覆盖范围可谓是涵盖了生活中的方方面面,包括制造、医疗、法律、 金融、科技、媒体等领域的专业知识。
从“文心”全景图来看,大模型主要包含了三大方向:
NLP(自然语言)大模型
CV(计算机视觉)大模型
跨模态大模型
之所以如此分类,是因为百度希望文心能够像人类一样,通过对语音、图像和视频等,从不同模态、异构信息综合地去理解世界。
更进一步的,便是让大模型能够具备更强、更稳的通用性。
例如在不久前发布的鹏城-百度·文心大模型,包含2600亿参数,是全球最大中文单体模型。
它就像是一个学霸,无需花费大量时间去“死记硬背”,仅是学习了“教材”10%的内容,便能取得与其它主流大模型相媲美、甚至是超越的成绩。
而百度文心大模型的提出,相辅相成的,也让其背后百度大脑的能力更上一层楼。
这不,王海峰在现场就上演了一段“用嘴作画”:
百度大脑,我们一起创作一幅水墨画吧。
这边是连绵的山脉,山上云雾缭绕,山脚下有一座草堂建在江边,江上有 一条船,一个人站在船头;然后这边有一行飞鸟掠过天空。
话音刚落,一幅颇有意境的中国水墨画便立即呈现了出来。
有了画作,怎能少得了诗词。这不,王海峰便补充道:
百度大脑,为这幅画作首诗吧。
随机,与画作相匹配的一首诗词也被分分钟创作了出来。
不难看出,在大模型加持下的百度大脑,让其应用更具智慧,也展现出了更贴近人类的能力。
大模型与自动驾驶共同的开发平台
知识增强大模型、自动驾驶等虽属于技术的不同方向,但在百度,他们有着同一个核心技术在背后支撑。
也就是百度自研的飞桨深度学习平台。
百度对飞桨的定位是一个开源开放的产业级深度学习平台,除了为百度自己的诸多业务提供支持外,还希望助力各行各业的创新和发展。
在2021年末这个时点看来,这种助力作用已经在AI的开发、训练和部署流程都得到体现。
在开发阶段,飞桨提供了丰富的API,并于2020年率先实现动态图与静态图两种编程模式统一。
“动静统一”能够兼顾科研开发需要的灵活,和产业开发需要的高效。
另外,今年飞桨还针对科研开发新增了一系列科学计算API,和高阶自动微分等新功能。
可支持量子计算、生命科学、计算流体力学、分子动力学等前沿领域模型开发。
在训练阶段,飞桨今年发布了自适应大规模分布式训练技术。
针对模型特点和硬件特点,搜索最优的机器组合和模型切分策略,并采用异步流水运行机制,以及高通信和高并发的方式,使大模型训练效率达到最优。
刚刚发布的全球首个千亿级知识增强大模型也是基于这项技术训练出来的。
在推理和部署阶段,飞桨打造了推理部署工具链,让高速推理引擎实现多端多平台的便捷部署。
飞桨提供的模型蒸馏压缩工具,可将大模型参数规模压缩至 1/1000。
同时保持满足产业实际需求的性能,帮助开发者加速业务落地。
为了支持更多不同行业的开发者,百度还做了两件事。
一个是为降低适配成本设计的统一的硬件接入方案,当前已适配的芯片或IP已有31款。
另一个是官方产业级模型库,提供从大模型到兼顾精度与性能的小模型超过400个。
相关产业的合作伙伴可以直接选用,或使用这些模型根据实际需求做快速调整。
截至目前,飞桨平台上已汇聚406万开发者、服务15.7万家企事业单位,位居中国深度学习平台综合市场份额第一。
从零基础的初学者到资深开发者,都能在飞桨找到适合自己的技术方案。
从前沿技术研究到产业应用落地,也都能在飞桨获得支持。
不过,飞桨平台并不是百度的AI核心技术引擎百度大脑的全部。
AI的快速发展还离不开算力的支撑,在这方面百度又有哪些新动作?
绿色算力底座
首先看算力供应中最关键的芯片。
百度自主研发的通用AI芯片——百度昆仑,今年也迎来升级。
作为国内第一个采用GDDR6显存的芯片,昆仑2代芯片与1代相比性能提升2-3倍,并在8月实现量产。
同时,昆仑芯片与飞桨等多款深度学习框架完成端到端适配,具备软硬一体的全栈国产化AI能力。
昆仑芯片也应用在了百舸——百度6月发布的AI异构计算平台。
百舸平台由AI计算、AI存储和AI容器组成,具备大算力、大吞吐、极致弹性的特性,能支持超大数据、超大模型的训练。
有了昆仑芯片和百舸平台的算力供应,接下来要说的是数据中心。
数据中心发展上,今年的关键词是绿色低碳。
百度的数据中心通过极简供电、高效制冷、智能控制等多项技术,将能源利用效率(PUE)降至1.08。
也就是说,每有一度电用于给设备供电,只需要额外0.08度电用来给设备散热,远远低于全球1.59的平均水平。
其中,百度阳泉数据中心,还获得国内首个5A低碳数据中心认证。
总结下来,百度大脑近年来在核心技术、开源开放平台、算力底座上都取得了新的突破和进展。
那么凭借这些进展,百度AI又取得了哪些成绩?
百度的AI技术到了什么水平?
整体概括一下,横向看AI技术,纵向看产业应用。
前沿技术方面,百度分别在生物医药、量子计算取得新进展。
百度推出了业界首个mRNA疫苗序列设计算法,可以在短短十分钟内找出稳定的疫苗序列,已和中国疾病预防控制中心开展进一步合作。
还打造了百度量子平台,提供国内首个从应用到量子处理器一站式服务。降低量子计算学习与应用的门槛,特别是在化学、金融、材料等领域的应用。
产业应用方面,基于百度智能云“云智一体”的优势,百度大脑的能力被输送到各行各业。
智慧工业上,百度发布开物工业互联网平台,与重庆两江新区联合打造“AI+工业互联网”产业基地。
智慧能源上,百度智能云与国家电投集团东方能源(000958)共同打造了“智慧数字热网”,已经在石家庄落地。
智慧城市上,北京海淀城市大脑基于百度技术和基础设施打造,让城市管理更快速、高效和智能。
用于城市的AI技术与建设经验还可以拓展到乡村。在山东寿光,百度用AI技术加持蔬菜大棚,老乡们也可以用小度语音助手学习农艺知识。
除了智能云在全国各地、各行业开花结果…
这场大会本身,也是百度技术的一次集中展现。
“元宇宙”一词成为热点不过几个月,百度就在元宇宙里办了一场可容纳10万人的开发者大会。
百度用这种展示肌肉的方式证明:技术嘛,库里都有,早有储备。
另外,百度对元宇宙的发展思考也比较明确——不会引入虚拟货币、数字收藏品或虚拟炒房。
而是想打造出一座开发者之城,让每一个开发者共同创作这个无限生长的空间。
目前,希壤的版本号定在负6.0,也是将元宇宙技术定位在早期阶段,有待未来继续探索。
更重要的是,即便是在虚拟的元宇宙世界开大会,百度最后落脚地还是在真实的物理宇宙。
在这次大会上,还有一个环节是李彦宏与中国探月工程首任首席科学家欧阳自远院士的对话。
两人探讨了人工智能在感知、控制两个能力上为航天服务的前景,希望AI开发者能够深度参与航天事业中去。
从遥远的宇宙与元宇宙探索,到近在眼前的产业智能化升级,所有的科技创新背后关键在于人。
在过去,这种创新主要依靠科研工作者和技术开发者来完成。
百度持续用融合创新降低技术开发和应用的门槛,并推动人工智能技术的开源开放,是为了让更多人参与进来。
李彦宏认为,人们每搭乘无人车多跑一公里、和智能音箱多说一句话,都能让AI更聪明、更安全、更值得信赖。
越多的人参与,技术的迭代就会越快,下一次技术革命也就更快到来。
某种意义上,百度AI正在把开发者这个概念扩展成创造者——
让你我都能成为创造者。
让每个创造者都能用AI改变这个世界。
本文首发于微信公众号:量子位。文章内容属作者个人观点,不代表和讯网立场。投资者据此操作,风险请自担。
(王治强 HF013)