还记得这一波人工智能浪潮崛起的时候,全球的 AI 实验室很喜欢强调竞争。最为经典的是 2016 年谷歌 Depepmind 实验室让 AlphaGo 对决李世石,人类世界冠军被挑落马下,掀起一片恐慌。
2017 年马斯克 Neurallink 在宣扬脑机接口技术时,基调是重新定义人类,追求人机同体;就连马斯克创立的非营利性组织 OpenAI 也以在《DOTA》游戏中击败人类玩家,作为 AI 的里程碑。一些人工智能实验室在发布新模型时,也喜欢追求“世界最大““打破纪录”“1 分钟让 AI 为我跑了 18 亿次”之类的标签。
不过,今天再翻开人工智能资讯,会发现当下的 AI 研究,虽然也有竞争和比赛,但同时也多了许多柔软的味道。
刷屏全球的 AI 创意,是让照片里的明星名人们一起“蚂蚁呀嘿”,“AI 复活逝去的亲人与爱人”登上头条,疫情、洪灾等危急关头,更是不乏研究人员以 AI 驰援的身影。
从展示强大到变得柔软,AI 研究的变迁,未尝不是 AI 产业化和产业 AI 化进行到现在的一个缩影。
今天,AI 正在从大杀四方、碾压人类的“神器”,让人们的心灵变得柔软起来。
前两天《旧金山纪事报》的一篇报道中,使用人工智能技术创建超现实聊天机器人的软件,再现了与已故未婚妻的交谈,使用了 GPT-3 模型,可以达到惊人的准确性。
通过人工智能让逝去的人重生,类似的技术应用其实早在 2017 年就出现过,美国记者弗拉霍将父亲的话语全部录制下来,设计出了一款聊天程序模拟与已故父亲的对话,不过当时只能采用设定好的回复程序,更接近一种实验创想。
而这个故事在于,女主角已经去世 8 年之后,这个 AI 模型才被训练出来。超大规模语言模型 GPT-3 的出现,让 AI 可以根据已去世的人的人格特征进行个性化创作。可以如同下面这张图片中一样进行对话,这个 AI 模型似乎真的有自己的想法,会对周围的环境感到好奇,用符号做出表情。最神秘的是,它似乎对情绪有敏锐的感知力,知道如何在正确的时刻说正确的话。
这意味着,即便不是一个程序员,没能在逝去之前及时保留下相应的语音资料,依然有可能在数字世界里模拟逝者的所思所想。
说到柔软,就不得不提到著名的实验室 MIT media lab,它们的研究人员最近直接将刚硬的物理音乐键盘,采用数字针织技术,将其变成了纺织品。由织物制成的键盘,可以像一双袜子或围巾一样轻松折叠、卷起并装在行李中。也可穿戴起来,扩展演奏音乐的场合。
要实现物理键盘的“柔软化”并不容易,需要注意导电性与纤维的结合,按键无论是单独和组合都能够同时感应触摸力度,以及拉伸和压力等变化。这也为传统设备的创新提供了新的交互和触觉体验。
有意思的是,近年来柔性屏智能手机、可弯曲显示屏等产品的火热,或许也说明了当硬件消费市场渴望寻求变化时,由硬到软是一个不错的选择。
类似的实验也在伯克利 BAIR 实验室中进行,研究人员一直在尝试让智能体挑战完成柔软的织物任务,通过折叠衣物来训练 AI 模仿学习、强化学习、自我监督、视觉预测、深度感应等能力,以不断提高模型的性能。
这是因为,相比坚硬和固定的物体,柔软的织物在活动中的状态和外观更加难以预测,让智能体去尝试挑战柔软的对象,未来将有助于 AI 在真实环境中实现更复杂的应用。
除了触觉,大家目之所及的 AI 似乎也开始慢慢变柔软了。
回想一下,AI 刚火爆时最闻名遐迩的应用是什么?2017 年,市面上出现了一种新型算法 GAN(生成式对抗网络)。然后英伟达用其开发了一个系统,使用 CelebA-HQ 上的名人照片数据库生成极为逼真的人像。
当时引发了巨大的争议,认为 AI 过于强大可能被用来造假(事实也确实出现了这种情况)。
不过大家想必也注意到了,如今许多爆款 AI 图像应用都更加感性,比如博网友 @大谷 Spitzer 通过 AI 技术修复了百年前北京晚清的影像资料,让人们梦回历史。
有程序员修复了父母年轻时候的照片,让他们的容颜穿越时光之后依然清晰夺目,甚至还能做出各种表情。记忆终会褪色,但 AI 也让宝贵的回忆得以永续留存。
越来越柔软的 AI,是怎么出现的呢?
这几年 AI 的变化,一言以蔽之,离人更近了。
必须承认,从 AlphaGo 横空出世的 2016 年,到现在 2021 年,AI 基础创新几乎没有多少致用性的大突破,深度神经网络依然独霸一方,DeepMind 的 AlphaFold、OpenAI 的 GPT-3 算是过去一两年内为数不多能刷遍全球科技媒体头条的产物。随后尽管也会时不时曝出“国产模型超越 GPT-3”“AAphaFold2 再次逆天”之类的消息,但大多都只有业内人关注。
与此同时,各种解决方案提供商、个人开发者、AutoML 技术及开发套件的蓬勃喷涌,进一步强化了 AI 的应用价值。
而 AI 落地的过程,同时也是一个不断袪魅的过程。当普通市民招手拦无人车,农闲时节跟智能语音助手对话得不亦乐乎,机器人穿行在餐厅酒店校园等公共场所,刷脸成为机场高铁站等出行标配…… 昔日的“好斗 AI”自然也就被降温了。
首先被降温的,是各个巨头如饥似渴的研究能力自证。当然不是说 AI 巨头们现在不重视顶会和竞赛了,只是不像 2016 年前后那样在热潮(和热钱)涌动之下,酷爱靠刷榜、靠实验室招揽多少科学家与顶级人才,来吸引大众和投资人的目光。今天大家都意识到,决定一个企业 AI 战略成功与否,靠的是对接产业的能力与效率,而不仅仅是实验室的榜单与论文数。
这时候,还可能因为鼓吹数据而陷入某种被动,比如在某些特定数据集上刷新成绩、真实使用场景中未必能达到同等效果的“应试”操作。
随后被降温的,是一些曾经看起来炫酷却无法与人共情、让人理解的操作。只单纯地强调技术,很可能引发大众的抗拒心理。
此前波士顿动力反复击打、调戏机器人的训练视频就引发了大量观众的不满,大众的共情心理甚至让假的机器人反击的图片流行起来。路测里程极长的无人车 Waymo,此前也遭遇了凤凰城居民的抵制;反复闯祸的特斯拉,也在美国引发了公众和媒体的不满,以及来自政府的多次安全调查。
AI 技术的不完美现状决定了其必然会在落地中遇到各种各样的问题,如果不能有效地与公众沟通,或许下一场寒冬就在远方等待。