作者/杜晨
来源:硅星人(ID:guixingren123)
“钢铁侠”马斯克在 Twitter 上可谓是一呼百应了。这不,就连发个招聘会的通告都有十多万人点赞,上万人转发:
虽然名字酷炫至极:AI Day(人工智能日)。但事实上,这个活动很可能是个“招聘会”。这不,马斯克自己也说了,这一届 AI Day 的唯一目标,就是吸引全世界最优秀的 AI 人才加入特斯拉:
这是自从特斯拉去年10月彻底裁掉了整个PR部门之后,举办的第二次,也可能是该公司今年的最后一次公开活动了。
为什么开个招聘会都要搞得如此大的阵仗呢?还不是因为特斯拉真的是留不住人。最近,已经在公司勤勤恳恳了11年的汽车业务高管 Jérôme Guillen 宣布了离职。除了 Guillen,特斯拉在 AI 方面的团队,特别是负责自动/辅助驾驶技术研发的团队,人员流动率也不低。
可能这也是为什么特斯拉的相关自动/辅助驾驶功能和技术,一直备受指责质疑,安全性不足,且至今未能达到预定的 L4/5 级别的原因。本周,美国政府还宣布启动了对 Autopilot 以及相关辅助驾驶功能的调查。
再这样下去,马斯克的“终极计划:第二章”(Master Plan: Part Deux),就要跳票了!
所以,特斯拉才要大力地招人!招人!
这次 AI Day,就是为了招人这个目的而举办的。为了吸引最优秀的 AI 人才,这次特斯拉真的把家底全都抖出来了:
今天,特斯拉展示了其内部用于 Autopilot/FSD 自动/辅助驾驶算法训练、数据标注的超级计算机 Dojo:
特斯拉也公开了”路测模拟器”,一个用来“凭空”生成更多虚拟的路测数据标注数据集的系统。它包括了上千种独特的汽车、行人和物体模型,目前已经为特斯拉积累了数千英里的虚拟路测数据:
更酷的是,马斯克还首次公开宣布了特斯拉正在打造一款“通用型”人形机器人的消息!
开个玩笑……其实是下面这个。这款机器人叫做Tesla Bot:
接下来,让我们更详细地了解一下这次AI Day的主要内容。
Dojo 超级计算机
虽然 Autopilot/FSD 的表现并不稳定,最近也因为卷入多起事故而备受指责,但毫无疑问,特斯拉仍然是在真实驾驶环境里投放自动/辅助驾驶技术,规模最大的汽车公司。
为了保证 Autopilot/FSD 的持续进步,特斯拉需要经常更新它们背后的神经网络模型。模型的更新需要更多的数据、更大规模的训练和更强大的计算性能。事实上,现在特斯拉已经感觉市售的硬件无法满足它的需求了。
所以从2019年,特斯拉开始了一个神秘的项目 Project Dojo。而今天,我们终于一睹它的真容:一个可以无缝连接,实现超大规模分布式计算、超高I/O带宽的多芯片模组(MCM)超级计算机。
Dojo 的核心是特斯拉自主研发的 D1 处理器:采用7nm制程工艺,单片包含500亿枚晶体管,线路长度高达11英里。处理器采用了完全自定义的指令集设计,32位浮点计算性能可以达到22.6TFLOPs。其热设计功率高达400W。
另外,特斯拉方面宣称 D1 处理器的 I/O 带宽是目前行业最顶级网络芯片的两倍水平。
特斯拉宣称,D1 处理器在浮点计算性能和片外带宽 (Off-chip Bandwidth) 上,都远远领先于谷歌的 TPU 和其它顶级科技公司自己用 GPU 打造的分布式计算阵列的水平:
超高的片外带宽尤为重要,因为对于特斯拉而言,D1 Chip 不是一枚一枚用的,而是可以1500枚芯片组成阵列,
再把25个阵列放在一块晶圆上,就形成了一个训练模组 (Training Tile)。这才是 Dojo 超级计算机的单元核心。
9PFLOPs 计算性能
36TB/s 带宽
占用空间小于1平方英尺
特斯拉宣称 Training Tiles 是目前世界上已完成开发的最强大的多芯片模组。
当然,为了确保在模组化、规模化之后,每一枚 D1 处理器仍然能够保持最高效率运行,模组在 I/O、供电、散热设计等问题上,都面临巨大的挑战。
这一点倒是难不倒特斯拉。马斯克也在会上说:“我们毕竟是一家高科技汽车公司,在处理关键计算设备散热问题上有很多的经验,这些经验也可以套用到 Dojo 上。”
Training Tile 模组采用直流电直接输入模式。单枚模组的总电流高达18000A。模组上方是一块巨大的液冷散热单元。据 Dojo 团队人士透露,这个散热单元可以实现对整个模组15KW功率的散热。
这还没完!
接下来,特斯拉还会再把 Training Tiles 组合起来,每6个模组一个机柜:
再把机柜之间连接起来,还能够继续保持单个模组的理论带宽水平:
变成最终的完全体:DojoExaPod将是世界上(理论)最快的AI训练超级计算机。
120枚 Training Tiles 模组
3000枚 D1 处理器
超过100万个训练节点
高达1.1 ExaFLOPS(16位浮点)计算性能
此外,特斯拉还为 Dojo 系统加入了虚拟化设计,可以针对训练使用需要进行分区。这就变成了 DPU:Dojo Processing Unit。
接受采访时,马斯克也表示,目前 Dojo 系统的首要任务是服务特斯拉自己内部需要,包括并不限于路测数据标注、模型训练、跑模拟环境生成更多路测数据等各类任务。
但是,Dojo 本质上是一个 ASIC 属性的计算设备,也就可以被看作是一个通用型的神经网络训练设备。未来,不排除 Dojo 也是可以提供给其它机构使用的。
下图显示了 Dojo 的软件堆栈:
Dojo的宣布,让特斯拉摇身一变,也终于成为一家芯片公司了。难道任何属性的科技公司,最终都会殊途同归,变成芯片公司?
从目前公开的信息来看,Dojo 简直太酷了。但是需要明确的是,特斯拉上周才刚刚完成了首个 Training Tile 的工作测试,成功在这个模组上面跑了 Autopilot 部门老大、AI 大神 Andrej Karpathy 开发的的 minGPT 模型。
(也就是说,不管今天特斯拉怎么吹 Dojo,后面这些超级计算机的部分,都还是在放卫星……)
Tesla Bot 人形机器人
之前早有业界传闻特斯拉正在开发机器人,没想到是真的。在临近本次 AI Day 末尾的环节,马斯克突然搞了一个 One More Thing,向大家隆重介绍这款机器人:Tesla Bot。
马斯克还邀请 Tesla Bot 上来表演了一段魔性的舞蹈。它活动自如、姿态优美,简直把波士顿动力秒出三条街好吗?
当然,这又是马斯克的玩笑,真的机器人,现在还不能动……
马斯克说:“和 Dojo 不一样的是,Dojo 是真的,Tesla Bot……也会是真的。”也就是说,目前的 Tesla Bot 还只是个壳而已。
至于为什么要做 Tesla Bot,马斯克解释道:“其实说来,我们特斯拉已经是世界上最大的机器人公司之一了。你换种方式思考,我们的汽车,其实就是带轮子的智能机器人。”
(几年前的版本还是“会跑的 iPad”呢……)
马斯克表示,把特斯拉在机器人、传感、AI 等技术上的进步植入到一个人形机器人上,好像是有点意思的。
马斯克说:“(这个机器人)当然是对人类友好的。”它的使命,是代替人类,去完成危险、重复和无聊的工作。
Tesla Bot 的身高是5尺8寸(大约172cm),体重150磅(约68kg),行进速度5英里/小时。
Tesla Bot 是一个人形机器人。但它的头上不会有五官,而是一个屏幕显示一些对用户有用的信息。它的全身包括总共40个电动“关节”,特别是在手部,包含了总共12个马达控制的关节。
驱动 Tesla Bot 的则是一块 FSD 处理单元,也就是今天大部分支持 FSD 的特斯拉车型都有的车载计算机。机器人的眼睛,则是几枚 Autopilot 系统的摄像头。
基本上,把特斯拉汽车里的零部件和软件功能扒下来,七七八八拼凑出一个人形机器人,这就是 Tesla Bot 了!
对于 Tesla Bot,马斯克的初步设想是让用户可以对他提出简单的命令,比如“把那个灯泡装上去”之类的,它就可以执行。Tesla Bot 是一个“泛用型 AI 机器人”,而非那种更加复杂的,涉及到人机智慧型交流的机器人。
“我们对于 Tesla Bot 的设计指标,是让你可以轻松地躲开它(不被它追上),而且有很大的机会制服它。”马斯克邪魅地一笑……
“最好这样的情况不会发生,但谁知道呢。”
目前,Tesla Bot 还处于非常早的开发阶段。马斯克也在台上展示了一台(还不能动)的原型机,并且透露能工作的原型机应该明年能造出来。对于是否、何时要正式进入机器人(特别是特指的人形机器人)的行业,他自己也没有个明确的想法。
特斯拉虽然有种种问题,但不可反驳的是,这家公司能够走到今天,靠的真就是对科技创新的疯狂追逐,和马斯克本人强烈的、谁都无法阻挡的意志。
所以特斯拉能真的造出 Tesla Bot 吗?答案肯定是没问题。未来它能派上什么用场?目前真的没人知道。
也许在未来的某一天,Tesla Bot 可以取代特斯拉在全球各地的汽车制造工厂里面的工人。他们的工作确实危险、重复且无聊。
特斯拉上海超级工厂外部的深夜路边摊(图片来源:品玩)