更新 iOS 17 beta 后,我惊喜地发现自家狗狗出现在相册分类里,原先的「人物与地点人类」变成了「人物、宠物与地点」。
不仅我家的雪纳瑞土豆,还有前段时间朋友寄养在我家的柴犬薯条,都精确地出现在分类里。
这个看似微不足道的功能其实是 AI 机器学习进化的成果,类似的功能在苹果生态里还有很多,默默地切实地改善着用户的体验。
苹果几乎不会提及 AI 这个概念,但 AI 早已融入苹果生态每个角落,这一点在 WWDC 2023 后的苹果产品各个新版系统中尤其明显。
许多人使用的苹果输入法在 iOS 17 里得到了 AI 加持,有了自动纠正功能,它可以预测用户想要打出的文字,还会不断学习用户的输入习惯,帮助用户高效输入。
苹果软件工程高级副总裁 Craig Federighi 表示:
(甚至)当你想输入一个 Ducking word(避讳词)的时候,键盘也会自己学习(你的输入习惯并预测你想输入的内容)。
输入体验的提升得益于苹果对设备端 Transformer 模型的优化,[b]而很多人不知道的是, Transformer 是支持 ChatGPT 的重要技术之一。
新款 AirPods Pro 通过机器学习实现的自适应音频模式,可以识别到外部特定声音时会自动在降噪模式和通透模式间切换,极大降低了用户手动切换的频率。
还有 iPad OS 17 利用机器学习模型识别 PDF 中的字段,用户可以快速用通讯录中的姓名、地址和电子邮件来填写相关信息。
不少人期待的日记 app Journal 可以利用机器学习技术,根据用户近期活动智能记录生活瞬间,包括照片、人物、地点、体能训练等等。它还可以自动给照片、音乐、录音等条目添加详细信息,方便日后回溯。
万众瞩目的 Vision Pro 为用户打造数字化身这项功能也用到了机器学习技术 —— 先进的「编码器-解码器」神经网络。
watchOS 10 的智能叠放,到底当下应该选择哪个更重要的信息进行展示,也是 AI 来决定的。
就连 iOS 17 和 iPadOS 17 的动画都用到了 AI 技术,机器学习模型能够合成额外的动画帧,让设备展示出华丽流畅的慢动作效果,这也是不少尝鲜 beta 的人觉得动画变得更流畅优雅的原因。
▲ 还有 Hey Siri 变成 Siri,也是 AI 的功劳
可以这么说,大众以为的 AI「差生」苹果可能是一个 AI「狂魔」。
一直以来,苹果对机器学习的宣传重点都是「基于本地运行」和「保护隐私」。
在 ChatGPT 风头正盛的时候,苹果公司 CEO 库克曾表示:
人工智能(AI)潜力很大,尽管苹果已经将机器学习和 AI 技术应用于部分产品,但在具体应用上相对克制和谨慎,AI 还有很多问题需要解决。
▲ 苹果公司 CEO 库克接受采访,谈论 AI
当被问到如何看待 ChatGPT 时,苹果公司 CEO 库克首先说到 ChatGPT 背后的大语言模型蕴含「巨大潜力」,不过他也表达了自己的担忧,「偏见、错误信息等问题,在某些情况下可能会更糟」,AI 需要监管,研发和使用这些 AI 的公司有责任自我监督。
最近 OpenAI 就因为隐私问题遭遇集体诉讼,美国加州一家律师事务在长达 157 页的诉讼书中称 OpenAI 秘密地收集数据,以训练其大型语言模型,使其聊天机器人能够模仿人类语言,并通过爬取网络获取了巨量数据,包括从社交媒体网站获取的大量数据。该诉讼要求暂停商业访问和开发 OpenAI 产品,实施更多规定和保护措施。
同时 OpenAI 的投资者微软也被列为被告,诉讼称,像 OpenAI 这样的科技巨头为了追求技术进步,不顾对人类的灾难性风险,滥用了其极高的技术能力。这也目前大部分生成式 AI 产品的问题,他们几乎都未经授权抓取大量互联网内容进行算法参数训练,Midjourney、Stability AI 等明星公司也陆续遭到侵权法律诉讼
以苹果对隐私安全的重视程度,显然不会采用这种充满争议的方式,基于相对谨慎的态度,苹果生态里和 AI 相关的功能基本都是依靠本地机器学习实现的,所需的数据量很少,一定程度上避免了数据上云训练 AI 这个敏感问题。
这一点和以 ChatGPT 为代表的服务器集群、超级计算机和海量级数据模型打造的 AI 不同,苹果的 AI 显得低调和另类。
不过这并不意味着苹果对 AI 不那么积极,苹果公司 CEO 库克也明确表示:
我们认为人工智能浪潮非常宏大,我们会继续以非常周到的方式在产品中接入 AI。
ChatGPT 火爆以来,苹果明显增加了和 AI 相关的岗位招聘,这就是苹果积极看待 AI 最好的证明之一。
苹果生态中的 AI 不上云,那么它是如何实现的呢?
答案就藏在苹果自研芯片中。
在 WWDC 2023 上,备受期待的 M2 Ultra 芯片正式登场,它采用了第二代 5 纳米工艺制造,拥有多达 24 个 CPU 内核、76 个 GPU 内核和 32 个内核的神经引擎,每秒可进行 31.6 万亿次运算。
苹果表示 M2 Ultra 最高支持 192GB 的统一内存,在一个单一系统中可以训练庞大的机器学习工作负载,比如大型 Transformer 模型。再提一遍,Transformer 是支持 ChatGPT 的重要技术之一。
这块芯片强大的地方在于内存。运行相同的大型 Transformer 模型时,目前最强大的独立显卡也无法处理,因为内存不足,而 M2 Ultra 游刃有余。
这样就意味着,每台搭载苹果自研芯片的设备都是一台可以在本地训练 AI 的设备,而且被训练的 AI 是完完全全为这台设备的个人用户服务的。
这种策略的好处在于,是可以在更短的时间内将 AI 能力提供给更多用户。目前大模型所需的算力成本极高,明星 AI 初创公司 Inflection AI 最近融资了 13 亿美元,领投的是英伟达,然而 Inflection AI 转头就花 11 亿美元向英伟达购买了 2.2 万块 H100 芯片,大模型居然开始成为像煤炭、石油、钢铁这样重资产行业。
按照 GPT-4 每千个提示词的成本高达 12 美分推算,如果要将 ChatGPT 部署到苹果全球超过 20 亿台设备,运行的成本将是天文数字,也会大大提升终端设备成本。
如果说 OpenAI 是集约式的,犹如一颗所有人都可以调用的大脑,那么苹果的 AI 则是分散式的,仿佛存在于每个人身体里的无数个细胞。
ChatGPT 的爆火之后,苹果不止一次被怀疑「掉队了」。
事实真是如此吗?
实际上早在 2016 年,苹果斥资 2 亿美元收购了 Turi(一家致力于从事机器学习和人工智能研究的创业公司)布局人工智能领域,获得了 Turi 在开发机器学习工具和平台方面的专业知识。
2019 年,苹果再次花费 2 亿美元收购了 Xnor.AI 公司,为苹果产品提供了低功耗基于边缘的 AI 技术。
因此,在前几年的苹果产品中,用户经常能使用上 AI 驱动的功能,例如 Siri、相册分类和搜索等,只不过苹果太「高冷」了,根本不会像其它公司一样进行高调的宣传。
▲ 相册分类已进化多年,在机器学习的加持下变得更加精准
作为 AI 公司,如果要说苹果的 AI 技术没自家公司先进,可能很多人会表示赞同,但要说苹果的 AI 毫无布局且一事无成,那就是轻敌了。
当以 ChatGPT 为代表的 AI 从软件出发,正在对如何和硬件相结合感到棘手的时候,苹果所做的是让 AI 在软硬件层面结合,还顺利推广到了消费者群体中,每位用户都正在使用着。
虽然 ChatGPT 推出两个月后月活用户就突破 1 亿,但和很多大模型产品一样依然存在着不小的使用门槛和局限性,现在对话框里的聊天机器人也并非 AI 终极的交互方式。
AI 公司 Cohere 的 CEO Aidan Gomez(著名论文《Attention is all you need》的主要作者之一)表示,目前 AI 系统的能力终究是有限的,因为并非所有的内容都是文本形式。
我们现在的模型确实是字面意义上的「盲人」,这需要改变。
现阶段,对于全球绝大多数人来说,iPhone 可能还是他们最先感受到 AI 带来的体验跃升的地方。
每年 20 亿台活跃着的苹果设备都是一台处理器强悍的 AI 训练设备,还是用户心甘情愿掏钱自购设备无形中训练 AI,目前也只有苹果能做到了。
正如爱范儿此前分析所说的,与 ChatGPT 等大模型相比,苹果 AI 更注重的是,如何提升终端用户的体验。
这是典型的苹果产品模式,1997 年乔布斯在一次公开大会上,被一名程序员当众质疑不懂技术,乔布斯给出了这样的回答:
不要沉迷在所谓的技术里,你必须从客户体验入手,然后再回过头去开发技术,而不是从技术入手,然后再试着想办法,这个技术能用到哪?我认为这才是做事的正确方法。