字数 3185,阅读大约需 16 分钟
![特斯拉 特斯拉Dojo:自动驾驶计算的破局之路](https://ai.codexiu.cn/wp-content/uploads/2025/01/image-2025-01-03-Tesla-特斯拉-擎天柱2代-.webp)
一、Dojo的起源与初步设想(2019年)
2019年4月22日,在特斯拉的Autonomy Day上,特斯拉AI团队深入探讨Autopilot和Full Self – Driving及其背后的AI技术,并分享专为神经网络和自动驾驶汽车定制的芯片信息。埃隆·马斯克(Elon Musk)首次提及Dojo,称其是用于训练AI的超级计算机,还指出当时生产的所有特斯拉汽车已具备完全自动驾驶所需硬件,只需软件更新。
2019年全球自动驾驶领域快速发展,众多公司加大研发投入。例如谷歌旗下的Waymo持续推进自动驾驶技术研发,在路测里程等方面成果显著。特斯拉提出Dojo概念,旨在打造定制化超级计算机,为自动驾驶技术提供强大计算支持,以在竞争中占据优势。
二、Dojo的宣传推广与能力初现(2020年)
(一)2月2日:全球布局与能力展望
马斯克宣称,特斯拉很快将在全球拥有超一百万辆联网车辆,这些车辆配备实现完全自动驾驶所需的传感器和计算设备。他大力宣扬Dojo的能力,称其能处理海量视频训练数据,高效运行超空间阵列,后续将披露更多信息。
(二)8月14日:发布时间预估
马斯克重申特斯拉计划开发名为Dojo的神经网络训练计算机,用于处理海量视频数据,称之为“一头猛兽”,并预计Dojo第一个版本约一年后推出,即2021年8月左右。
(三)12月31日:安全标准与Dojo作用
马斯克提到,Dojo虽非实现自动驾驶的必需条件,但会使自动驾驶更好。他强调Autopilot不仅要比人类驾驶员更安全,最终需比人类驾驶员安全10倍以上。
2020年全球自动驾驶汽车市场规模持续增长。各大公司积极提升自动驾驶技术的安全性和可靠性标准,特斯拉对Dojo的定位和规划顺应这一趋势,通过强大计算能力提升自动驾驶技术安全性。
三、Dojo正式亮相与技术细节公布(2021年)
(一)8月19日:正式官宣与芯片发布
特斯拉在首届AI Day上正式宣布Dojo诞生,该活动旨在吸引工程师加入其AI团队。同时,特斯拉推出D1芯片,并表示将与英伟达的GPU一同为Dojo超级计算机提供动力,其AI集群将容纳3000个D1芯片。
(二)10月12日:技术白皮书发布
特斯拉发布Dojo Technology白皮书——“特斯拉可配置浮点格式与算法指南”,概述用于深度学习神经网络的新型二进制浮点算法技术标准,该算法可在软件、硬件或两者任意组合中实现。
2021年AI芯片市场竞争激烈,英伟达等公司在GPU领域领先。特斯拉推出D1芯片用于Dojo构建,展示其在AI计算硬件领域的自主研发能力,试图打破传统芯片供应商限制,为自身AI发展提供针对性硬件支持。
四、Dojo的进展与目标设定(2022年)
(一)8月12日:逐步推进计划
马斯克表示特斯拉将逐步引入Dojo,称明年无需购买过多增量GPU。
(二)9月30日:硬件测试与目标设定
在特斯拉第二届AI Day上,公司透露已安装首个Dojo机柜,并进行2.2兆瓦的负载测试,当时每天制造一块由25个D1芯片组成的模块。活动现场展示Dojo运行Stable Diffusion模型生成“火星上的Cybertruck”AI图像的过程。公司计划在2023年第一季度完成一个完整的Exapod集群,还计划在帕洛阿尔托总共建造七个Exapods。
2022年全球超级计算机领域不断发展,新技术和架构层出不穷。特斯拉在Dojo建设上稳步推进,其目标设定体现对自动驾驶技术计算需求的规划,也显示在超级计算机领域的野心,试图打造专属于自动驾驶训练的强大计算平台。
五、Dojo的潜力与挑战(2023年)
(一)4月19日:成本与服务潜力
马斯克在特斯拉第一季度财报会议上向投资者表示,Dojo“有潜力将训练成本降低一个数量级”,且“有可能成为一项可销售的服务,像亚马逊网络服务一样提供给其他公司”。同时,他指出Dojo是“风险较大的赌注”,但值得一试。
(二)6月21日:运行状态与计算能力预测
特斯拉AI X账号发布消息称,公司神经网络已应用于客户车辆,发布展示特斯拉当前和预计计算能力的时间线图表,将Dojo生产起始时间设为2023年7月,但未明确指D1芯片还是超级计算机本身。同一天,马斯克表示Dojo已在特斯拉数据中心上线运行任务。公司预计到2024年2月左右,特斯拉计算能力将跻身全球前五,到2024年10月达到100 exaflops。
(三)7月19日:生产启动与资金投入
特斯拉在第二季度财报中指出已开始Dojo生产。马斯克表示,特斯拉计划在2024年之前在Dojo上投入超10亿美元。
(四)9月6日:计算限制与解决方案
马斯克在X平台发文称,特斯拉受限于AI训练计算能力,英伟达和Dojo将解决此问题。他提到管理特斯拉汽车每天产生的约1600亿帧视频数据极其困难。
2023年自动驾驶技术对计算能力需求呈指数级增长,特斯拉面临计算资源和数据管理双重挑战。Dojo在降低成本和拓展服务方面潜力备受关注,但要实现目标,还需克服诸多技术和资源难题。
六、Dojo的发展规划与相关波折(2024年)
(一)1月24日:高风险高回报项目
在特斯拉第四季度及全年财报电话会议上,马斯克再次承认Dojo是高风险、高回报项目。他表示,特斯拉采取“英伟达和Dojo双路径”,称“Dojo正在发挥作用”,“承担着训练任务”。同时,特斯拉扩大其规模,计划推出Dojo 1.5、Dojo 2、Dojo 3等后续版本。
(二)1月26日:建设投资与成本比较
特斯拉宣布计划投资5亿美元在布法罗建造一台Dojo超级计算机。随后,马斯克在X平台淡化此投资,称5亿美元虽数额巨大,但“仅相当于英伟达的10000个H100系统。特斯拉今年在英伟达硬件上的花费将超这一数额。目前,要在AI领域具备竞争力,每年投入至少需数十亿美元。”
(三)4月30日:下一代训练模块生产
据IEEE Spectrum报道,在台积电北美技术研讨会上,台积电表示Dojo的下一代训练模块——D2已在生产。D2将整个Dojo模块集成在单个硅片上,而非像之前连接25个芯片组成一个模块。
(四)5月20日:超级计算机集群建设规划
马斯克指出,德州超级工厂扩建部分的后部将建设“一个超密集、水冷式超级计算机集群”。
(五)6月4日:芯片调配风波
CNBC报道称,马斯克将数千个为特斯拉预留的英伟达芯片转移到了X和xAI。最初马斯克称该报道为假,随后在X平台发文解释,因德州超级工厂南部扩建工程仍在继续,特斯拉无合适地方安置并启用这些英伟达芯片,“否则只能闲置在仓库中”。他还提到,该扩建区域将“容纳50000个H100用于FSD训练”。此外,他透露:“在我所说的特斯拉今年将在AI相关支出的约100亿美元中,大约一半用于内部,主要是特斯拉设计的AI推理计算机和所有汽车中配备的传感器,以及Dojo。对于构建AI训练超级集群,英伟达硬件成本约占三分之二。我目前对特斯拉今年购买英伟达硬件的最佳估计是30亿至40亿美元。”
(六)7月1日:硬件升级需求
马斯克在X平台透露,当前特斯拉车辆可能不具备适配公司下一代AI模型的硬件。他表示,下一代AI参数数量预计增加约5倍,“如果不升级车辆推理计算机,很难实现这一目标”。
(七)7月23日:英伟达供应挑战
在特斯拉第二季度财报电话会议上,马斯克表示对英伟达硬件需求“极高,以至于常常难以获得GPU”。他认为,“因此,我们需要在Dojo上投入更多精力,以确保拥有所需训练能力。并且我们确实看到了Dojo与英伟达竞争的潜力。”特斯拉投资者资料中的一张图表预测,到2024年底,特斯拉AI训练能力将从6月的约40000个等效H100 GPU提升至约90000个等效H100 GPU。当天晚些时候,马斯克在X平台发文称,Dojo 1到年底将拥有“约8000个等效H100的在线训练能力”,并发布超级计算机照片,其外观与特斯拉的Cybertruck一样采用类似冰箱的不锈钢外壳。
(八)7月30日:AI5量产时间预估
马斯克在回复一篇声称要成立“特斯拉HW4/AI4车主俱乐部,以表达对AI5推出后被抛弃的不满”的帖子时表示,AI5距离大规模生产大约还有18个月。
(九)8月3日:Cortex亮相
马斯克在X平台发文称,他参观了“德州超级工厂的特斯拉超级计算集群(又名Cortex)”。他指出,该集群将由大约100000个英伟达H100/H200 GPU组成,并配备“用于FSD和Optimus视频训练的大容量存储”。
(十)8月26日:Cortex展示
马斯克在X平台发布一段Cortex的视频,并称之为“正在特斯拉奥斯汀总部建造的巨型新型AI训练超级集群,用于解决现实世界的AI问题”。
2024年,特斯拉在Dojo发展过程中面临技术升级、资金投入、硬件供应等多方面情况。同时,Cortex的出现为特斯拉的AI训练带来新布局和发展方向。
七、2025年的现状
2025年1月29日,特斯拉2024年第四季度及全年财报电话会议未提及Dojo。然而,位于奥斯汀超级工厂的特斯拉新型AI训练超级集群Cortex亮相。特斯拉在股东资料中指出,已完成Cortex部署,该集群由大约50000个英伟达H100 GPU组成。资料提到:“Cortex助力实现了FSD(Supervised)V13版本,由于数据量增加4.2倍、视频输入分辨率提高等改进,该版本在安全性和舒适性方面取得重大提升。”在电话会议中,首席财务官Vaibhav Taneja指出,特斯拉加速Cortex建设,以加快FSD V13推出。他表示,截至目前,包括基础设施在内的AI相关累计资本支出约为50亿美元。Vaibhav Taneja还称,预计2025年与AI相关的资本支出将保持平稳。