最近 AI 领域有一则爆炸新闻,Google 一位软件工程师认为 Google AI 模型 LaMDA 已经具备了「自我意识」,并公布了一份长达 21 页的对话报告来证明,可我对「AI 觉醒」还有点存疑。
AI 真的发展到这个程度了吗?毕竟连语音助手这个作为应用最广泛的 AI 技术,也常被用户吐槽「人工智障」,即便在最能让语音助手发挥所长的驾驶场景,我身边不少老司机都选择让其吃灰。
昨天的华为夏季发布上,华为发布了和赛力斯联合打造的 AITO 品牌第二款车型问界 M7,我也第一时间体验了这款车型,在 M7 里的鸿蒙座舱里,没想到带我最大惊喜的不是内饰、座椅、音响,而是语音助手小艺。
作为一个资深的华为用户,我对小艺的能力已经相当熟稔,可这次她却还是给我带来了全新的体验,我也开始理解那名 Google 软件工程师的感受,因为这个 AI 实在太像人了。
中国乘用车智能语音交互功能的搭载率在 2021 年已经达到了 86%,但实际上很多司机都很少使用这一功能,因为那些看起连小孩子都能轻易理解的指令,「高大上」的 AI 却难以理解。
2016 年一位山东司机在车上「大战」语音助手一段视频至今仍是 B 站的热门视频,这位司机大哥想让语音助手打个电话,可无论说多少次,那个带着甜美女声的语音助手死活听不懂。
类似的经历可能很多驾驶者都不陌生,从我自己的体验来看,至少有这些情况让我对车载语音助手失去耐心:
上车启动后,想要用语音助手设置空调、座椅通风、导航、音响等多个功能,要反复唤醒,每次还要等待它播报完再唤醒,效率可能比手动更慢。
搭载家人朋友出行的时候,语音助手可能会被副驾和后座声音干扰,不小心误触或者听不清指令,你也发出语音指令前可以让大家安静一下,可想想都尴尬,要是碰上熊孩子还有安全隐患。
通过语音助手唤醒车载屏幕里的应用后,部分操作还是得动手滑动或点击。
在对问界 M7 的体验里,我也重点考验了华为小艺在上述场景中的表现。
多音区智慧感知:家庭出行神器
在家庭出行中,你可能也遇到过这样尴尬的情景,车内坐满了一家老小,司机想换首歌,副驾想调整座椅,后排乘客想打开车窗,还有熊孩子在大喊大叫,正在开车的你要分神满足家人不同需求。
这次问界 M7 上的多音区智慧感知终于可以解决这个烦恼了,小艺可以准确识别来自主驾、副驾、后排等车内各个位置的指令,车内人员可以独立对小艺下达指令。
我模拟了一下家庭出行的场景,在车内不同座位坐满了人,同时对小艺发出不同指令,小艺都能及时按照我们吩咐提供服务,还能关掉熊孩子的所在的音区,防止他捣乱。
要达到这样的体验需要优秀的软硬件协同,首先要通过分布在车内四周的麦克风列阵,让小艺识别到不同位置的音源,然后还要过滤掉非目标声源的噪音,才能准确识别。
目前支持多音区的汽车其实不少,但部分由于 AI 算法和软硬件没有适配好,正确识别率不高,或者需要特别大声或靠近麦克风才能成功,体验参差不齐。
而我和同事体验小艺的多音区感知时,以平时的说话声音和坐姿基本就可以顺利下达指令,体验还是相当顺滑。
连续对话:这才是和人说话的状态
前面提到多音区感知需要排除干扰声源,才能让小艺识别需要听到的指令,当她做好了这件事,自然而然就能实现另一个实用的功能——连续对话。
简单来说,就是你可以直接向小艺一次性下达多个指令,不用每一次都重新唤醒她,中途也可以打断她,回个语音讯息或闲聊几句小艺也能自动屏蔽无效的指令,小艺可支持 60 秒的连续对话。
这对于司机来说是一个十分实用的功能,比如我上车后,设置一个导航目的然后再增加一个途径地点,然后打开空调、座椅通风,最后打开上次没听完的播客节目,一气呵成。
而且这次小艺还新增了主驾免唤醒快捷指令,不用每次操作都喊一句小艺,更加高效,车内多人时也不会尴尬。
以前我极少在车上用语音操控这些功能,不是汽车不支持,而是我要喊 N 次 xx 同学,还得等待每次指令执行完,远不及我手动操作快捷。
可视可说:把声音当作鼠标,解放双手
虽然现在车载语音助手可以操控的功能越来越多,可平时在通过语音打开一些应用功能后,下拉翻页、切换选项卡等操作往往还是需要点击屏幕,如果功能藏得比较深,进入多级菜单查找,在驾驶中还有安全隐患。
在问界 M7 上,这种不人性化的交互体验已经开始被厂商重视并改善。小艺支持「可视可说」,屏幕上看到的功能都可能直接用语音控制,就像用声音当做鼠标直接「滑动点击」,再也不用动手了。
这一功能也适配了海量第三方应用,我测试了像喜马拉雅、QQ 音乐等比较常用的应用,十分流畅。
不仅如此,用户也不用记住十分准确的指令,说出「第一个」这样的表述都小艺就能懂了,不用花更多时间盯着屏幕,在驾驶过程中也更不容易分心,这点好评。
小艺建议:真的懂我了
说到中控屏幕,虽然是第一次体验问界 M7 ,但我操作起来并不陌生,这是可能因为我已经在手机上习惯了使用鸿蒙系统,其中「小艺建议」这个智能推荐功能从手机到车内的体验也有了些变化。
在手机上「小艺建议」会在下班路上给我提示快递信息,根据我所处的位置推荐餐馆等信息等。在问界 M7,「小艺建议」同样能根据驾驶习惯和场景判断用户的状态,给出相应的建议。
比如在油量/电量过低时,小艺建议会主动提示附近加油站/充电站,并询问是否需要导航。甚至如果你下车忘了拿手机,小艺也会主动提醒。
可见无论是被动需求还是主动需求,小艺已经能做出比较准确的判断了。而小艺从手机到车上的无缝流转,让我感觉 M7 的车机交互体验已经非常趋于智能手机了。
自定义声音:一个有人情味的彩蛋
在这次的体验中,我还发现了小艺一个让我惊喜的彩蛋,就是自定义声音,这意味着我可以将小艺的声音换成家人、恋人或朋友的声音,只需要录入一段声音,小艺很快就能学会。
根据国际普遍认可的语音质量评测方法微软 MOS 标准,AI 的声音越接近人声,就越令人感到舒适。此外小艺还支持粤语、四川话等方言的识别,我也终于不用操着一口「煲冬瓜」广普和她吵架了。
科幻电影《她》里,男主角爱上了一个 AI 语音助手,很大程度是因为 AI 的声音,当然斯嘉丽约翰逊的声音有多少男生能抵抗呢?
熟悉的声音可以让小艺显得一个有情感的人,交互过程更加真实、自然,我也更加愿意和她交流。如果将小艺的声音变成你爱的人,哪怕 ta 已经不在你身边了,何尝不是一件浪漫的事?
而且小艺还支持自定义唤醒词,,整体的感受就更像和身边的朋友交流,这似乎也体现了华为未来的语音交互,要朝着拟人化发展方向。
尽管目前市场上的 AI 还未真正达到「意识觉醒」这样的水平,但这次体验下来,小艺给我的印象确实越来越像人了,起码我可以尝试把她当做一个正常人来交流。
这也让我想起了钢铁侠里的 AI 管家贾维斯,10 多年过去了,我们终于有望拥有真实的「贾维斯」了?
上周欧盟通过了 2035 年起禁售燃油车的提案,汽车行业正在迎来工业时代后最大的变革。「新四化」(电动化,网联化,智能化,共享化)成为行业大潮,未来汽车行业将从硬件之争变成数据和系统之争。
大众集团 CEO Herbert Diess 对汽车行业未来的判断正在成为现实:
未来,车将成为一个最复杂,但最有价值的互联网设备。
未来,乘客使用车的频率将增加,使用时间可能翻倍。
未来,车将不再是一个简单简单的盒子,是一个更舒适、更温馨的空间。
汽车的智能化已经是不可逆的趋势,其中语音交互已经成为车厂构建智能体验的核心功能。随着自动驾驶技术的发展,语音助手未来无疑会成为人车交互最重要的载体,甚至可以说是新造车时代新的「三大件」之一。
这就需要一个聪明的语音助手,能像人一样和你交流,这也是小艺给我的印象。从静态体验来看,我认为问界 M7 上的小艺的智能化体验已经属于车载语音助手里的第一梯队。
最近小艺也获得汽研 CATARC 首张车载语音助手 A 级权威认证,在包括电话、导航、车控、可见即可说、唤醒响应、语义联想、多轮交互等 18 个子项的测试中均表现优秀,进一步印证了我的判断。
换句话说,小艺可能是目前车载语音助手里,能以最接近人类的交流方式和用户沟通的一个。
AI 正在以远超人类的速度进步,像小艺这样的语音助手变得越来越懂你也不用过于惊讶。可这与「贾维斯」尚有距离,因为「贾维斯」的智能不只是体现在他聪明,而是几乎可以在任何场景进行深度的融合适配,成为一个覆盖全场景万能管家。
在华为的版图里,这可能才是小艺的终极形态。
在新造车浪潮中,以问界 M7 为代表的智能座舱的人机交互体验,越来越丰富。而且这些功能服务的也不仅仅是驾驶本身,而是开始拓展到和车相连的数字生活场景,比如用车机控制智能家居设备,甚至根据上班或下班场景给你提出建议。
这样的发展仿佛当年智能手机兴起时,通话以外的服务场景层出不穷,手机逐渐成为人们数字生活的重要载体。如今华为或许也能借助智能座舱完善自己的全场景的互联生态,让汽车这个「移动终端」将成为智慧生态里重要的入口。
连接多场景本身并不难,但要让生态终端之间的交互智能顺滑却不容易。过去使用的蓝牙、ZigBee 等协议的互联体验,就相当于给用脆弱的独木桥一座座「孤岛」,经不起风浪,如同鸡肋。
而小艺的任务,就是要帮助华为生态里大量的终端的交互趋于自动化。
换言之,小艺将是华为全场景生态设备又一个重要入口。目前华为通过 HarmonyOS 已经逐步实现跨终端、全场景的无缝协同,未来华为生态里面设备都可以在小艺这个智慧助手的管理下为用户提供更多场景化的智慧化服务,根据用户在不同时间段、地点以及行为习惯,调动相关设备功能将最恰当的服务在最恰当的时候提供给用户。
当更聪明更有「人味」的小艺无缝串联起家-车-随身等三大场景,将硬件资源、系统能力、服务生态融合,基于用户意图提出建议并高效执行。那我们也就真正拥有了钢铁侠「贾维斯」,科技的魔法再一次将我们带入一个新时代。
华为也终将在此基础上,发展成为一家「超级终端公司」,正如我们此前对于华为未来的观点:
超级终端公司并不取决于终端种类的多寡,而在于对核心元器件和操作系统的把控,对生态系统的控制力和影响力以及对人机交互的前瞻性探索。