下载
登录/ 注册
主页
论坛
视频
热股
可转债
基金
下载
下载

特斯拉AI帝国基石Dojo:为视频数据训练而生 铺就通往AGI之路

23-09-12 10:37 296次浏览
沙滩小子
+关注
博主要求身份验证
登录用户ID:
什么是Dojo?
Dojo是特斯拉 自研的超级计算机,可利用海量视频数据,完成“无人监管”的数据标注和训练。
从字面意思来说,Dojo意为“道场,武馆”,这也正应和了它的意义——特斯拉为AI打造的修行场。
在2021年的AI Day上,特斯拉就已发布Dojo超级计算机,但当时其“羽翼未丰”,尚只有第一个芯片及训练块,公司仍在推动构建完整的Dojo Exapod。
而特斯拉也表示,理论上,Dojo ExaPod将是世界上最快的AI训练超级计算机。之后Dojo Exapod终于揭开面纱,每个 Dojo ExaPod 集成120个训练模块,内置3000个D1芯片,拥有超过100万个训练节点,算力达到1.1EFLOP*(每秒千万亿次浮点运算)。微架构方面,每个Dojo节点都有一个内核,是一台具有CPU专用内存和I/O接口的成熟计算机。
目前,Dojo被用于人工智能机器学和计算机视觉训练。特斯拉已从今年7月开始生产Dojo超级计算机,朝着更快、更便宜的神经网络训练迈出重要一步;公司计划2024年底前在Dojo上投入超过10亿美元;未来,特斯拉计划同时使用英伟达 和Dojo的算力。
根据特斯拉在6月发布的算力发展规划,Dojo将在明年一季度成为全球排名前五的算力设施,并将在明年10月达到100 EFlops算力。
▌马斯克“AI帝国”的基石
可以说,Dojo已成为马斯克“AI帝国”的基石设施。
回顾2019年,马斯克首次对外介绍Dojo时所说的:
特斯拉确实有一个重大项目,我们叫它Dojo。它是一个超级强大的训练计算机,目标是输入海量数据 并在视频层面进行训练……通过Dojo计算机,我们可以对大量视频进行无监督的大规模训练。
的确,如果说人工智能的养料是数据,那么特斯拉自动驾驶的养料便是视频数据。
为了实现完全神经网络而非代码控制,FSD V12每天从特斯拉车队获取约1600亿帧视频用于训练,但其中最有用的视频只有不到1%。马斯克表示,特斯拉设想的神经网络必须接受至少100万个视频训练之后,才能成型。到今年年初,FSD V12已完成了1000万个视频分析。
就在8月底,马斯克刚刚通过直播“秀了一把”FSD V12。
在这场直播中,车辆在非预设道路上,能自行礼让行人、避开路障、路口转向。马斯克多次强调,FSD V12中没有任何一行相应代码,人为设定车辆作出这些动作——FSD 12完成这些行为完全是大量视频训练的结果。通过视频训练数据,AI可以自己学驾驶,“像人类一样做事”。
当然,平庸随意的数据是不够的,供给神经网络的数据需要精心挑选。马斯克也特别强调,来自优秀驾驶员的高质量数据,才是训练特斯拉自动驾驶的关键。
“大量平庸的数据并不能改善驾驶,数据管理相当困难。我们有很多软件,可以控制系统选择什么数据、训练什么数据。”
▌通向通用人工智能
而如今,对于马斯克来说,Dojo的价值已不仅限于自动驾驶业务,实际上,Dojo已成为整个特斯拉AI业务体系发展的算力基础设施。
人类约70%信息是通过视觉感知获取的,这也是特斯拉计划为汽车及机器人准备的方案。
特斯拉之前已透露,特斯拉机器人
机器人:300024 12.67 0.24% +自选Tesla Bot“擎天柱”头部将配备与自家汽车相同的智能驾驶摄像头,并与汽车共用AI系统,换言之,特斯拉人形机器人延续了以视觉为主的传感技术路线。
马斯克今年6月曾透露,Dojo已经上线并运行了几个月,且其不单单适用于特斯拉的全自动驾驶之中。另外他表示,Dojo V1是面向大体量的视频训练而高度优化的,并非是面向通用目的AI(general purpose AI);但Dojo V2将突破这一限制。
这也意味着,升级版的Dojo,更有可能瞄准通用人工智能(AGI)。 $阿尔特(sz300825)$
打开淘股吧APP
1
评论(0)
收藏
展开
热门 最新
提交