大模型竞赛加剧，OpenAI最大对手发布Claude 3，可预测美国经济

观点

2024

03/05

16:30

亚设网

大模型竞赛加剧，OpenAI最大对手发布Claude 3，可预测美国经济

图片来源：Anthropic官网

当地时间3月4日，没有任何预告，位于美国硅谷的人工智能创业公司Anthropic在社交平台X上宣布发布大模型Claude 3，宣称全方位超越GPT-4。Anthropic被视为OpenAI最大的竞争对手，最初由OpenAI前高管层创立，背后的大投资者有谷歌和亚马逊，与OpenAI背后的微软形成阵营对比。

Anthropic表示，Claude有先进的高级推理、视觉分析、代码生成、多语言处理等功能。目前Anthropic发布了Claude 3的三个版本：Claude 3 Haiku（Haiku意指俳句）、Claude 3 Sonnet（Sonnet意指十四行诗）和Claude 3 Opus（Opus意指艺术作品），这三个版本功能依次增强，价格成本也依次上升，Opus版本最强大。

据Anthropic官方发布的视频，Claude可以使用一系列工具，来预测美国GDP走势。Claude3 Opus可以使用网页视图工具，进入网页的URL链接并利用多模态中的视觉能力查看网页信息。Claude 3 Opus还使用Python解释器来写出代码，渲染图像，将数据生成折线图。结果显示Claude预测的GDP走向的准确度在5%以内。

大模型竞赛加剧，OpenAI最大对手发布Claude 3，可预测美国经济

Claude 3预测的GDP走向准确度在5%以内。图片来源：Anthropic官方YouTube

在让Claude 3分析世界上几大经济体的GDP变化时，Claude 3还使用了调度子代理的工具，能自行建立多个子模型代理（相当于Claude 3自身的多个版本），Claude3给这些子模型写提示词，指挥几个代理平行进行GDP的运算和预测。

据博主“数字生命卡兹克”测评，Claude有着目前大模型中一流的推理能力，甚至超越GPT-4。Claude官网给出的Claude 3测评结果显示，在使用MMMU多语言数学推理测试集来测试时，Claude 3 Opus达到90.7%的准确率，用的是0-shot，GPT4是8-shot，达到了74.5%。0-shot意味着大模型没有在Prompt里给任何示例，就直接被要求完成任务。而8-shot则是在提示词中给了8个示例。这说明Claude在不给出示例的情况下，利用提示词里的上下文来推理的能力更强，

大模型竞赛加剧，OpenAI最大对手发布Claude 3，可预测美国经济

图片来源：Anthropic官网

Anthropic表示，Claude能处理超长的上下文，有着近乎完美的记忆力。Claude 3 系列型号在发布时最初将提供 200K 上下文窗口。然而，所有三种模型都能够接受超过 100 万个词元的输入。为了有效地处理长上下文提示，模型需要强大的回忆能力。

一种叫“大海捞针”（NIAH）的评估，是测试Claude大模型从输入的海量数据中准确回忆并找到某个细小信息的能力。Anthropic使用开源文档，每个提示词中放置30个随机问题针，来训练Claude，结果Claude 3 Opus 不仅实现了近乎完美的召回率，超过 99% 的准确率，而且在某些情况下，它甚至识别出提示词中的“针”语句似乎是人类特意插入到原文中的，并识别这个测试本身的局限性。

据科技自媒体“平凡的平凡”测评，把刘慈欣2万字的小说《乡村医生》分别给到Claude 3和GPT-4后，提问历史学家的名字，Claude 3找出了历史学家名字所在段落，而GPT-4没找到。

另外，Anthropic的官方视频还显示，最轻量的Haiku版本Claude 3，可以做到将数千个扫描文档，这些PDF是扫描版而非文字版，即使对于不清晰的字迹，Claude大模型可以用视觉能力，通过上下文的推理来识别文字。随后，Claude 3分析并提取关键词，来转化为结构化的数据。这将简化出版商、医疗供应商、律师事务所的繁重的文件处理业务。

Anthropic 由 OpenAI 前高管 Daniela Amodei 和 Dario Amodei 兄妹于 2021 年创立。2023 年 9 月，亚马逊宣布投资高达 40 亿美元，谷歌随后在次月承诺投资 20 亿美元。2024 年 2 月，风险投资公司 Menlo Ventures 完成了一项额外投资 7.5 亿美元的交易。据纽约时报报道，Anthropic在一年内融资73亿美元。

据The Atlantic报道，2022年11月，当OpenAI高层得知Anthropic要发布Claude聊天机器人时，决定提前上线ChatGPT，随后这场席卷全球的AI风暴就此开启。2023年秋天，当OpenAI的首席执行官Sam Altman被董事会戏剧性地解雇时，董事会曾在那个混乱的周末邀请过Anthropic的首席执行官Dario Amodei来担任OpenAI的代理CEO，但是被Dario拒绝。

在Claude 3发布的几天前，3月1日，特斯拉首席执行官Elon Musk起诉 OpenAI 及其首席执行官Sam Altman，称OpenAI放弃了最初的造福人类的非盈利使命，转向为盈利而开发人工智能。Claude 3发布后，彭博社科技采访Anthropic联合创始人Daniela Amodei，问及Elon Musk起诉OpenAI一事时，Daniela表示Anthropic作为一家公益公司，致力于平衡AI的潜在力量，同时保证产品的可靠、安全，执行公司最初的愿景，即提高人工智能行业的水平，保证投入市场的模型产品尽可能安全。

THE END

OpenAI 加剧大模型最大竞赛

免责声明：本文系转载，版权归原作者所有；旨在传递信息，不代表亚设网的观点和立场。