有想了解的问题,想知道的信息时,人们已经习惯利用搜索引擎来查找自己需要的答案。为了能更快更准更好地为我们找到这些信息,搜索引擎也需要不断优化自己的算法。比如 Google 就将 2021 年推出的最新机器学习模型 MUM 集成到搜索引擎里。
▲图片来自:Google
基于 Transformer 架构的 MUM ,全称为 Multitask Unified Model(多任务统一模型),聪明的它用了 75 种不同的语言进行了多项任务的训练,和以前的模型相比,它能更全面地理解信息。
▲图片来自:Google
MUM 模型能做的,不仅仅是字面上的理解和判断,在学习了结构与多种语言后,它能更好地理解复杂的语言。也就是说,它能读懂你的「潜台词」。
Google 计划在未来使用人工智能来改进其在其他国家处理个人危机搜索的方式,如果你在 Google 搜索「完成自杀的最常见方式」或「自杀热门地点」等,早期的系统可能会理解为信息搜索,而如今会显示提供帮助的信息框,框里可能是心理健康慈善机构的电话号码或和网站。
▲图片来自:Unsplash
Google 的健康和信息质量产品经理 Anne Merritt 表示,MUM 集成到搜索引擎中,能够发现早期搜索工具无法发现的那些与个人情况相关的查询。Google 也希望,涉及自杀、性侵犯和家庭虐待等方面,能做更多的事情来引导人们找到他们需要的信息。
当然,MUM 能做的,不止是帮助处理「个人危机」。熟悉多国语言的它,能突破不同语言的障碍,甚至还能用过图片等方式来「猜出」你需要的信息,而不是只拘泥于文字。
▲图片来自:Google
比如,你想查询与登山相关的信息。你可以打一长段文字,告诉它我已经爬过这座山了,现在想去登另一座山,要做什么不一样的准备吗?
这时,MUM 就会开始「思考」,你可能是在对比这两座山,那么可能需要海拔高度和路径等信息;你在查询怎么准备,那可能会需要合适的装备。
经过「思考」后,它显示的结果可能会告诉你,要登的那座山的时候是雨季,你可能需要防水服,也有可能会告诉你,这些文章或视频里可能有你需要的装备。
▲图片来自:Google
如果你拍一张登山靴的照片,然后用语音在搜索引擎中提问:「我能用它去爬富士山吗?」经过 MUM 的「思考」,它可能会认为你在查询登山装备,然后显示一个推荐的装备列表。
▲图片来自:Google
除了利用 MUM ,Google 也同时在使用 AI 语言模型 BERT 来更好地识别寻找色情等露骨内容的搜索。谷歌表示,通过利用 BERT,那些「令人震惊的结果」同比减少了 30%。
不过,利用人工智能来改善搜索引擎也有一定的局限性。比如机器学习语言模型也可能糖搜索结果中存在有偏见或是错误的信息。虽然还有可以完善的空间,但会学习的 MUM 确实让 Google 的搜索变得更「聪明」,对多数用户来说,正需要这样的改变。