IT之家 10 月 2 日消息,在昨日的特斯拉 2022 AI Day 上,官方展示了其定制 Dojo 超级计算机的最新成果,功耗强到把当地的变电站都搞跳闸了。
Dojo 是特斯拉自己的定制超级计算机平台,用于人工智能机器学习,帮助训练其自动驾驶的视觉技术等。此前的 Dojo 搭载了英伟达的 GPU,而新版用上了特斯拉自己设计的芯片和基础设施。
特斯拉展示了 Dojo 超算完整的机柜,声称可以用一个 Dojo 单元替换 6 个 GPU,该公司声称其成本低于一个 GPU。每个机架有 6 个这样的单元。
Dojo 主机接口的介绍如下:
▲ 机柜关闭的样子
▲ 机柜打开的样子特斯拉 Dojo 首席系统工程师 Bill Chang 表示:“为了支持我们前所未有的冷却和功率密度,必须重新检查数据中心基础设施的各个方面,并开发自己的高性能冷却和电力系统来为 Dojo 机柜供电。”
Bill Chang 透露,今年早些时候在测试基础设施时把当地电网的变电站搞跳闸了。
“今年早些时候,我们开始对我们的电力和冷却基础设施进行负载测试,将功率推高超过了 2 兆瓦,然后变电站就跳闸了,还接到了市政府的电话。”
以下为完整集群 Dojo Exapod 关闭和打开时的样子:
特斯拉发布了 Dojo Exapod 的主要规格:1.1 EFLOP、1.3 TB SRAM 和 13 TB DRAM。IT之家了解到,特斯拉计划在帕洛阿尔托建造 7 个 Dojo Exapod 超算,首个计划在 2023 年第一季度建成。
相关阅读:
《特斯拉发布自主研发 AI 芯片 D1,用于训练超算 Dojo》