市值一夜蒸发 2300 亿美元后,扎克伯格开始拿出“AI 黑科技”拯救自己的身价了!
智东西 2 月 24 日消息,就在今天北京时间凌晨一点,扎克伯格特意举办了一场名为“元宇宙里的 AI”的活动,专门宣布了 Meta 在 AI 领域的技术布局,这也是扎克伯格 2022 年首次谈及 Meta 将在语音翻译、AI 创造以及语音助手等领域重点发力。
会上,Meta 宣布研发一款为世界上每个人定制的翻译软件,研究人员通过构建高级的 AI 模型和一款可适用所有语言的翻译器,希望能在“元宇宙”中打造一个无障碍交流的空间。
Meta 计划研发一款新的 AI 系统 BuilderBot,你在虚拟世界中说什么,AI 就能给你展现对应的画面,看样子 AI 也能成为“阿拉丁神灯”一样的神器了。
不仅如此,Meta 新推出了 CAIRaoke 项目,研发人员开发了一个端到端的神经模型,它可以提供与人们进行更多的交流,可以比以前简单对话的层面更深一步,能够理解人们说话的语境。
最新财报显示,Meta 旗下专攻“元宇宙”的 Reality Labs 部门 2021 年亏损 102 亿美元。扎克伯格秘藏已久的 AI 大招,救得了声势渐垮的元宇宙吗?
▲ Meta 2021 年股价变化图
扎克伯格谈道,现在多数 AI 研究的重点是如何让 AI 更好地理解现实世界,但未来,AI 需要帮助人们在现实世界和虚拟世界都能实现导航等功能。并且由于虚拟世界总是在发生变化,AI 应该像人类一样拥有理解环境和学习的能力。
▲ Meta CEO 扎克伯格
“元宇宙世界中你将会与任何地方都能发生视觉交互,包括你在 3D 空间中的位置、面部、手势等等肢体语言,这些都需要不同的输入方式。”他认为 AI 是重要的数据入口之一。
扎克伯格不但介绍了 AI 在语音翻译、语音助手以及 AI 创造领域的应用,还简单谈了 Meta 在推动 AI 技术研究方面所作出的贡献。
目前,Meta 正在打造三个 AI 项目。
第一个是被称为 BuilderBot 的 AI 系统,该系统可以让人们通过描述虚拟世界的一部分来构建它们。他们通过一段视频展示 BuilderBot 未来的效果。比如说,当人们身处虚拟世界时,对这个系统说“我希望天上有片云”,AI 将会自动在岛屿上添加一片云。这么一想,如果该系统能够研发成功的话,在虚拟世界里“衣来伸手,饭来张口”的日子也不远了。
第二个项目是 Meta 希望打造一款能够像人类一样思考的 AI。Meta AI 的首席 AI 科学家杨立昆(Yann LeCun)提出,是否能够模仿世界的运作方式,打造一款“世界模型”的能力可能是该项目的关键之处。
“当今 AI 最重要的挑战之一是设计学习范式和架构,使机器能够以自我监督的方式学习世界模型,然后使用这些模型进行预测、推理和计划。”他说。
杨立昆尝试运用多种学科中的相关概念并将它们与机器学习中的新概念相结合,融入自我监督学习(self-supervised learning)和联合 — 嵌入式架构(joint-embedding architectures)模型中。
第三个项目则和 Meta 的“元宇宙”布局相关。在去年十月的活动中,Meta 就曾展示过一个“万能”的翻译对话软件,现在,这一场景背后的细节也逐渐浮出水面。
活动上,Meta AI 宣布将打造一款翻译工具,该项目将分为两个部分推进。第一部分是覆盖全语种,Meta 正在构建一个新的高级 AI 模型,该模型可以从需要训练的示例更少的语言中学习,然后实现数百种语言的专家级翻译。第二部分是打造通用语言翻译器,研究人员正在设计一些新方法,希望能将一种语言的语音实时翻译成另一种语言。
除此之外,扎克伯格也简单介绍了一下 Meta 在隐私保护、数据开放等方面做出的贡献。
Meta 与纽约大学朗格尼医学中心合作开展了一个名为“快速 MRI”的项目,可以利用 AI 从较少的数据中创建磁共振成像,从而实现更快的磁共振扫描。
“如果不仔细考虑我们如何以及何时发布数据,就无法真正推进科学研究。”同时,扎克伯格也提到在发布数据集时,他们会考虑以隐私和公平为指导原则。
Meta 的 AI 研究人员多年来一直在讨论如何建立一个丰富的、具有代表性的模型。并且这款新的模型不仅现在能够实现预测,还可以适用于未来。
“我们希望模型可以进行长期规划和推理,以便未来在现实世界和虚拟世界中都能做好 AI 代理。”Facebook AI Research 的总经理 Joelle Pineau 说。
▲ Facebook AI Research 的总经理 Joelle Pineau
此外,她还向大家介绍几个 Meta 正在重点研究的方向,其中有一款是“机器人”。
“它可以突破实验室或工厂等固定场景的限制。并且能够在家中、在办公室流畅地操作,自然地与人类交互。”Joelle Pineau 介绍道,“但我们同样需要机器人自己可以触摸等方式提高感知世界的能力。”
为此,Meta 一直在研发新的触摸传感器。Meta 正在与其他研究人员合作打造一款新的传感器,目前该传感器正处在原型阶段。
与其他传感器不同的是,该触摸传感器的外层会有一层薄薄的膜,膜上嵌有磁性颗粒。当触摸传感器变形时,磁信号就会改变。
通过这些变化,AI 技术可以推断接触点施加力的大小,甚至能使用自我监督学习模型来自动校准传感器,使其更适用于各种场景。
▲ 触摸传感器
不仅如此,Meta 还与其他研发机构合作开发的另一种数字传感器。该传感器的表面由可变形弹性材料组成,能够通过传感器内摄像头记录的图像变化来感受力的变化。
▲ 数字传感器
Joelle Pineau 也提到,虚拟世界与真实世界之间仍有很大差距,要建立一个可靠的世界模型还有很多工作要做。尤其是,从简单的物体到人的全身运动都能实时呈现高分辨率的虚拟环境。
在演讲中,她还宣布 Meta 的研究人员与 Instagram 的研究团队合作,计划发布一个名为 Instagram Feed Ranking 的原型系统。
机器翻译专家 Angela Fan 认为,语言是我们用来理解与周围世界互动的主要途径之一。
她介绍自己在加拿大生活以及在巴黎工作时,常常感受到语言障碍带来的深远影响。基于这些语音沟通壁垒,Meta 希望每个人都能感受到最新的翻译技术,“我们希望所有未来的技术在默认情况下都是具有包容性的。”
据预测,全球大约有 20 亿人说的母语没有任何可用的翻译系统。并且,全球有数千种语言,但翻译系统如今只支持大约 100 种语言。
如何创建真正适合每个人的翻译系统是 Meta 一直在思考的问题。
Angela Fan 认为,创建更具包容性的翻译的第一步是开发能够支持多种语言的系统。“我们要是想要实现多语种翻译,我们就需要必须为每一个语言方向创建一个单独的模型,这样一来,我们就要创建数万个模型,这是一件非常复杂的事情。”
为了解决这一难题,Meta 尝试根据不同的语言体系来加强模型的训练能力。比如说,罗曼什语作为一个小众语种,会与其他语言体系有共同点,语种之间的联系将会简化语言模型的开发过程。
“最近,我们在两个顶级翻译比赛中获胜。”她讲到,“我们证明了多语种系统确实比双语系统更好,通过增加模型大小,例如通过生成更多培训数据和缩小翻译规模,我们证明了多语种翻译是一个非常有前途的发展方向。”
除此之外,Meta 还可以自动创建一些翻译数据的示例,而无须雇用人员手动翻译大量数据。目前,Meta 已经支持一百多种语言实现自动创建数据集,并且部分数据集开源。
Meta AI 的高级研究经理 Alborz Geramifard 谈到语音交互助手可以分为三个类别。
第一类是初级的语音助手。比如说我们想要查询话费,打电话给客户服务,你会听到请按 1 键获得话费信息,请按 2 键获得订阅服务等。“你常常会发现你想要的服务不在选项列表中”。
第二类语音交互助手,但拥有可能有一些智能模型。“你可能会在家里和它们简单的互动。但它们不能理解语义背景,也不能进行深度交流。”
第三类是 Meta 想要打造的超级语音助手。这类超级语音助手延续了深层次的语境,可以为用户提供个性化体验。比如你想早晨放一首歌曲,同时窗外又在下雨,超级语音助手就会根据此刻的场景为你推荐一首歌曲播放。
他还谈到,能理解的 AI 和能交互的 AI 是两种不同的概念。能理解的 AI 是一个单向的过程,从输入到输出,比如说转录音频解析可以得到相应的文本。
▲ 理解式 AI 和实时交互 AI 的区别
而交互是用户和 AI 之间能实现连续对话。例如,詹姆斯可能想向尼克发送一条消息,说他将迟到五分钟。当 AI 完成相关操作时,詹姆斯想将时间修改到 10 分钟,在这种情况下,詹姆斯可以继续修改他的时间安排,AI 也能完成相关操作。在交互式的对话中往往会涉及连续决策的问题。
“我们的目标是将我们的项目打造的新模型与 VR / AR 设备相结合,通过 AI 实现更具沉浸式和多模态的交互形式。”
比如说,你的语助手可以帮助你制作美味的食材,根据你的食谱列出食材,并主动引导你完成整个过程菜谱。并且,当你在这道菜中添加了盐时,超级语音助手注意到你的盐越来越少了,所以帮助你下了一个购物的订单。超级语音助手与你之间的互动越来越紧密。
去年夏天,Meta 就曾发布了文章概述了其 AI 原则的五大支柱,包括隐私和安全、公平和包容、稳健性、安全性、透明度和可控性。
面对 AI 公平性,Facebook AI 的项目经理 Jacqueline Pan 谈到 AI 团队与另一个内部团队合作发布了一些对话数据集,这些数据集旨在帮助评估 AI 系统中可能存在的潜在算法。
最新的数据集将包含超过 45000 个付费参与者进行非脚本对话的视频,这些参与者透露了他们的年龄和性别,让 AI 能够相对公正地分析信息。
此外,Meta 还能够提供肤色和声音的标签,该数据集旨在帮助研究人员评估其计算机视觉和音频模型在这些维度上的准确性。
Meta 还曾在 2020 年与佐治亚理工学院的合作教学项目,以培养 AI 人才。
AI 研究人员将与佐治亚理工学院教员一起打磨一门深度学习课程开发课程,并作为该大学计算机科学在线硕士课程的一部分,其主要目标是帮助学生体验现实世界中学习扩展算法时会用到哪些技术。
据统计,第一年就有一千六百多名学生参加了这门课程,今年有近 2400 名学生完成了这门课程。并且,约 85% 的受访学生表示,他们在该课程上收获颇丰。
说起 2022 的开年,扎克伯格是真的惨。
自从重压元宇宙后,扎克伯格一边成为行走的元宇宙代言,直接带动全球元宇宙热度,另一边 Meta 的股市表现却愁云惨淡。这家曾跻身美股五巨头的科技企业,如今却颓势难挽,市值被昔日手下败将特斯拉、英伟达、台积电、腾讯压了一头。
今年 2 月 3 日,Meta 公布其最新财报,首次披露的元宇宙部门亏损从 2019 年 45 亿美元显著增加到 2021 年 102 亿美元。当天收盘其股价暴跌 26%,创下美股市场历史最大市值跌幅,市值跌超 2370 亿美元。
不仅股价暴跌、市值缩水,扎克伯格自己也掉出全球富豪榜前 10,不可谓不狼狈。
显然,人们对扎克伯格画的元宇宙“大饼”还处于观望状态。而今日凌晨,扎克伯格完全从技术角度出发,展示了一套依然紧密围绕元宇宙蓝图的前沿 AI 技术套餐,以创造一个更有说服力的故事。
但华尔街的投资者会为此买账吗?Meta 展示的技术蓝图,要真正支撑起扎克伯格编织的虚拟世界未来,尚需要一些时间。