亚马逊(AMZN.US)正在竞争激烈的生成式人工智能市场上奋起直追。该公司的云计算部门(AWS)本周在re:Invent全球大会上推出了芯片、AI工具等一系列产品。
AWS在此次大会上推出了更新后的自研通用服务器芯片Amazon Graviton 4和用于机器学习的训练、推理的芯片Amazon Trainium
2。据悉,Graviton 3处理器相比,Graviton 4与性能提升高达30%、独立核心增加50%以上、内存带宽提升75%以上,为在Amazon
EC2上运行的工作负载提供更优的性能和能效。
另外,与第一代Trainium芯片相比,Trainium 2训练速度提升多达4倍,并能在EC2
UltraClusters中部署多达100000个芯片,可以在极短的时间训练基础模型(FMs)和大语言模型(LLMs),同时能效提升多达2倍。
除了芯片之外,AWS也在大模型相关产品上迭代。亚马逊的AI大模型服务Bedrock能够让用户使用大语言模型和其他基础模型构建生成式AI的应用。Bedrock提供了对大量模型的访问支持,包括Anthropic的Claude模型。值得一提的是,今年获得亚马逊40亿美元投资的Anthropic被认为是OpenAI的劲敌,Anthropic的模型也成为了AWS服务中的一部分。
目前,亚马逊已经推出自研的Amazon Titan AI大模型,据悉还将推出更多模型。与此同时,Bedrock也推出新功能,包括新的fine
tuning(微调)工具、新的检索增强生成(RAG)技术、新的Agents使模型能够针对特定用例进行更加定制和优化。
AWS还推出了生成式AI驱动的助手Amazon
Q。该AI助手主要用于工作场景中,比如辅助员工完成日常工作、总结文件、回答公司政策等。亚马逊希望借此与OpenAI的ChatGPT和谷歌的智能聊天机器人Bard展开竞争。AWS首席执行官Adam
Selipsky表示,很多公司出于安全和隐私的担忧已经禁止了企业使用这些人工智能助手,对此,亚马逊设计Amazon Q时更注重安全性和隐私性。
目前,Amazon
Q的预览版本已上线,部分功能可免费使用,正式版本中企业用户的费用为每人每月20美元,具备额外功能的版本费用为每人每月25美元。相比之下,Microsoft
365的Copilot和Google Workspace的Duet AI均需支付每人每月30美元。
此外,亚马逊和加强了与英伟达(NVDA.US)的合作。英伟达首席执行官黄仁勋到大会现场共同讨论围绕生成式AI的开发。黄仁勋宣布部署全新的GPU系列
,包括最新的GH200,而AWS将是第一家在云端配备具有多节点NVLink技术的NVIDIA GH200 Grace Hopper
Superchips的云厂商。
另一方面,NVIDIA DGX Cloud 也将登陆 AWS。黄仁勋表示,DGX
Cloud是英伟达的人工智能工厂,可让企业和软件开发人员通过浏览器登入,即可获得英伟达的超级计算机DGX的AI算力。英伟达还与AWS合作推动Ceiba项目,该超级计算机将配置16384颗NVIDIA
GH200超级芯片,能处理高达65 exaflops速度等级的AI运算,从而推动生成式AI的创新。