导语:扎克伯格特意举办了一场名为“元宇宙里的AI”的活动,专门宣布了Meta在AI领域的详细技术布局,这也是扎克伯格2022年首次谈及Meta将在语音翻译、AI创造以及语音助手等领域重点发力。
市值一夜蒸发2300亿美元后,扎克伯格开始拿出“AI黑科技”拯救自己的身价了!
智东西2月24日消息,就在北京时间凌晨一点,扎克伯格特意举办了一场名为“元宇宙里的AI”的活动,专门宣布了Meta在AI领域的详细技术布局,这也是扎克伯格2022年首次谈及Meta将在语音翻译、AI创造以及语音助手等领域重点发力。
会上,Meta宣布研发一款为世界上每个人定制的翻译软件,研究人员通过构建高级的AI模型和一款可适用所有语言的翻译器,希望能在“元宇宙”中打造一个无障碍交流的空间。
Meta计划研发一款新的AI系统BuilderBot,你在虚拟世界中说什么,AI就能给你展现对应的画面,看样子AI也能成为“阿拉丁神灯”一样的神器了。
不仅如此,Meta新推出了CAIRaoke项目,研发人员开发了一个端到端的神经模型,它可以提供与人们进行更多的交流,可以比以前简单对话的层面更深一步,能够理解人们说话的语境。
最新财报显示,Meta旗下专攻“元宇宙”的Reality Labs部门2021年亏损102亿美元。扎克伯格秘藏已久的AI大招,救得了声势渐垮的元宇宙吗?
▲Meta 2021年股价变化图
一、CEO扎克伯格:Meta将发力语音翻译和语音助手
扎克伯格谈道,现在多数AI研究的重点是如何让AI更好地理解现实世界,但未来,AI需要帮助人们在现实世界和虚拟世界都能实现导航等功能。并且由于虚拟世界总是在发生变化,AI应该像人类一样拥有理解环境和学习的能力。
“元宇宙世界中你将会与任何地方都能发生视觉交互,包括你在3D空间中的位置、面部、手势等等肢体语言,这些都需要不同的输入方式。”他认为AI是重要的数据入口之一。
扎克伯格不但介绍了AI在语音翻译、语音助手以及AI创造领域的应用,还简单谈了Meta在推动AI技术研究方面所作出的贡献。
目前,Meta正在打造三个AI项目。
第一个是被称为BuilderBot的AI系统,该系统可以让人们通过描述虚拟世界的一部分来构建它们。他们通过一段视频展示BuilderBot未来的效果。比如说,当人们身处虚拟世界时,对这个系统说“我希望天上有片云”,AI将会自动在岛屿上添加一片云。这么一想,如果该系统能够研发成功的话,在虚拟世界里“衣来伸手,饭来张口”的日子也不远了。
第二个项目是Meta希望打造一款能够像人类一样思考的AI。Meta AI的首席AI科学家Yann LeCun提出,是否能够模仿世界的运作方式,打造一款“世界模型”的能力可能是该项目的关键之处。
“当今AI最重要的挑战之一是设计学习范式和架构,使机器能够以自我监督的方式学习世界模型,然后使用这些模型进行预测、推理和计划。”他尝试运用多种学科中的相关概念并将它们与机器学习中的新概念相结合,融入自我监督学习(self-supervised
learning)和联合—嵌入式架构(joint-embedding architectures)模型中。
第三个项目则和Meta的“元宇宙”布局相关。在去年十月的活动中,Meta就曾展示过一个“万能”的翻译对话软件,现在,这一场景背后的细节也逐渐浮出水面。
活动上,Meta
AI宣布将打造一款翻译工具,该项目将分为两个部分推进。第一部分是覆盖全语种,Meta正在构建一个新的高级AI模型,该模型可以从需要训练的示例更少的语言中学习,然后实现数百种语言的专家级翻译。第二部分是打造通用语音翻译器,研究人员正在设计一些新方法,希望能将一种语言的语音实时翻译成另一种语言。
除此之外,扎克伯格也简单介绍了一下Meta在隐私保护、数据开放等方面做出的贡献。
Meta与纽约大学朗格尼医学中心合作开展了一个名为“快速MRI”的项目,可以利用AI从较少的数据中创建磁共振成像,从而实现更快地磁共振扫描。
“如果不仔细考虑我们如何以及何时发布数据,就无法真正推进科学研究。”同时,扎克伯格也提到在发布数据集时,他们会考虑以隐私和公平为指导原则。
二、为元宇宙打造AI模型,Meta打造多款触摸传感器
Meta的AI研究人员多年来一直在讨论如何建立一个丰富的、具有代表性的模型。并且这款新的模型不仅现在能够实现预测,还可以适用于未来。
“我们希望模型可以进行长期规划和推理,以便未来在现实世界和虚拟世界中都能做好AI代理。”Facebook AI Research的联合董事总经理Joelle Pineau说。
此外,她还向大家介绍几个Meta正在重点研究的方向,其中有一款是“机器人”。
“它可以突破实验室或工厂等固定场景的限制。并且能够在家中、在办公室流畅地操作,自然地与人类交互。”Jér me介绍道,“但我们同样需要机器人自己可以触摸等方式提高感知世界的能力。”
为此,Meta一直在研发新的触摸传感器。Meta正在与其他研究人员合作打造一款新的传感器,目前该传感器正处在原型阶段。
与其他传感器不同的是,该触摸传感器的外层会有一层薄薄的膜,膜上嵌有磁性颗粒。当触摸传感器变形时,磁信号就会改变。
通过这些变化,AI技术可以推断接触点施加力的大小,甚至能使用自我监督学习模型来自动校准传感器,使其更适用于各种场景。
▲触摸传感器
不仅如此,Meta还与其他研发机构合作开发的另一种数字传感器。该传感器的表面由可变形弹性材料组成,能够通过传感器内摄像头记录的图像变化来感受力的变化。
▲数字传感器
Joelle Pineau也提到,虚拟世界与真实世界之间仍有很大差距,要建立一个可靠的世界模型还有很多工作要做。尤其是,从简单的物体到人的全身运动都能实时呈现高分辨率的虚拟环境。
在演讲中,她还宣布Meta的研究人员与Instagram的研究团队合作,计划发布一个名为Instagram Feed Ranking的原型系统。
三、打造“万能”翻译器,还支持百种语言自动标注
机器翻译专家Angela Fan认为,语言是我们用来理解与周围世界互动的主要途径之一。
她介绍自己在加拿大生活以及在巴黎工作时,常常感受到语言障碍带来的深远影响。基于这些语音沟通壁垒,Meta希望每个人都能感受到最新的翻译技术,“我们希望所有未来的技术在默认情况下都是具有包容性的。”
据预测,全球大约有20亿人说的母语没有任何可用的翻译系统。并且,全球有数千种语言,但翻译系统如今只支持大约100种语言。
如何创建真正适合每个人的翻译系统是Meta一直在思考的问题。
Angela Fan认为,创建更具包容性的翻译的第一步是开发能够支持多种语言的系统。“我们要是想要实现多语种翻译,我们就需要必须为每一个语言方向创建一个单独的模型,这样一来,我们就要创建数万个模型,这是一件非常复杂的事情。”
为了解决这一难题,Meta尝试根据不同的语言体系来加强模型的训练能力。比如说,罗曼什语作为一个小众语种,会与其他语言体系有共同点,语种之间的联系将会简化语言模型的开发过程。
“最近,我们在两个顶级翻译比赛中获胜。”她讲到,“我们证明了多语种系统确实比双语系统更好,通过增加模型大小,例如通过生成更多培训数据和缩小翻译规模,我们证明了多语种翻译是一个非常有前途的发展方向。”
除此之外,Meta还可以自动创建一些翻译数据的示例,而无须雇用人员手动翻译大量数据。目前,Meta已经支持一百多种语言实现自动创建数据集,并且部分数据集开源。
四、Meta计划打造超级语音助手,连续决策成AI交互关键
Meta AI的高级研究经理Alborz Geramifard谈到语音交互助手可以分为三个类别。
第一类是初级的语音助手。比如说我们想要查询话费,打电话给客户服务,你会听到请按1键获得话费信息,请按2键获得订阅服务等。“你常常会发现你想要的服务不在选项列表中”。
第二类语音交互助手,但拥有可能有一些智能模型。“你可能会在家里和它们简单的互动。但它们不能理解语义背景,也不能进行深度交流。”
第三类是Meta想要打造的超级语音助手。这类超级语音助手延续了深层次的语境,可以为用户提供个性化体验。比如你想早晨放一首歌曲,同时窗外又在下雨,超级语音助手就会根据此刻的场景为你推荐一首歌曲播放。
他还谈到,能理解的AI和能交互的AI是两种不同的概念。能理解的AI是一个单向的过程,从输入到输出,比如说转录音频解析可以得到相应的文本。
▲理解式AI和实时交互AI的区别
而交互是用户和AI之间能实现连续对话。例如,詹姆斯可能想向尼克发送一条消息,说他将迟到五分钟。当AI完成相关操作时,詹姆斯想将时间修改到10分钟,在这种情况下,詹姆斯可以继续修改他的时间安排,AI也能完成相关操作。在交互式的对话中往往会涉及连续决策的问题。
“我们的目标是将我们的项目打造的新模型与VR/AR设备相结合,通过AI实现更具沉浸式和多模态的交互形式。”
比如说,你的语音助手可以帮助你制作美味的食材,根据你的食谱列出食材,并主动引导你完成整个过程菜谱。并且,当你在这道菜中添加了盐时,超级语音助手注意到你的盐越来越少了,所以帮助你下了一个购物的订单。超级语音助手与你之间的互动越来越紧密。
五、开放数据集,Meta力图消除数据偏见
去年夏天,Meta就曾发布了文章,概述了其AI原则的五大支柱,包括隐私和安全、公平和包容、稳健性、安全性、透明度和可控性。
面对AI公平性,Facebook AI的项目经理Jacqueline Pan谈到AI团队与另一个内部团队合作发布了一些对话数据集,这些数据集旨在帮助评估AI系统中可能存在的潜在算法。
最新的数据集将包含超过45000个付费参与者进行非脚本对话的视频,这些参与者透露了他们的年龄和性别,让AI能够相对公正地分析信息。
此外,Meta还能够提供肤色和声音的标签,该数据集旨在帮助研究人员评估其计算机视觉和音频模型在这些维度上的准确性。
Meta还曾在2020年与佐治亚理工学院的合作教学项目,以培养AI人才。
AI研究人员将与佐治亚理工学院教员一起打磨一门深度学习课程开发课程,并作为该大学计算机科学在线硕士课程的一部分,其主要目标是帮助学生体验现实世界中学习扩展算法时会用到哪些技术。
据统计,第一年就有一千六百多名学生参加了这门课程,今年有近2400名学生完成了这门课程。并且,约85%的受访学生表示,他们在该课程上收获颇丰。
结语:元宇宙这盘棋,扎克伯格用AI技术下
说起2022的开年,扎克伯格是真的惨。
自从重压元宇宙后,扎克伯格一边成为行走的元宇宙代言,直接带动全球元宇宙热度,另一边Meta的股市表现却愁云惨淡。这家曾跻身美股五巨头的科技企业,如今却颓势难挽,市值被昔日手下败将特斯拉、英伟达、台积电、腾讯压了一头。
今年2月4日,Meta公布其最新财报,首次披露的元宇宙部门亏损从2019年45亿美元显著增加到2021年102亿美元。当天收盘其股价暴跌26%,创下美股市场历史最大市值跌幅,市值跌超2370亿美元。
不仅股价暴跌、市值缩水,扎克伯格自己也掉出全球富豪榜前10,不可谓不狼狈。
显然,人们对扎克伯格画的元宇宙“大饼”还处于观望状态。而今日凌晨,扎克伯格完全从技术角度出发,展示了一套依然紧密围绕元宇宙蓝图的前沿AI技术套餐,以创造一个更有说服力的故事。
但华尔街的投资者会为此买账吗?Meta展示的技术蓝图,要真正支撑起扎克伯格编织的虚拟世界未来,尚需要一些时间。
(文章为作者独立观点,不代表艾瑞网立场)