美东时间周一举行的2021年计算机视觉和模式识别会议上,特斯拉人工智能与自动驾驶视觉部门主管安德烈·卡帕蒂(Andrej Karpathy)公布了特斯拉超级计算机集群Dojo。卡帕蒂表示,Dojo尚未进行基准测试,根据FLOPS的排名来看,第五位的英伟达超级计算机集群Selene和Dojo架构和GPU类似,但前者GPU数量为4480个,比Dojo的数量少1280个。
根据5月英伟达芯片价格估算,一个节点设备的价格约为20万美元,Dojo共有720个节点,由5760个321TFLOPS英伟达显卡组成,理论总算力达到1.8EFLOPS,读写速度为每秒1.6TB,硬件成本约为1.44亿美元。特斯拉如此大规模的投入,其目的是对自动驾驶的神经网络进行训练。早在2019年,特斯拉CEO马斯克就有了超级计算机的研发计划,未来特斯拉的超级计算机的算力将达到每秒ExaFLOPS的级别,意味着每秒达到一百亿亿次的浮点算力。
值得注意的是,随着大疆、华为等国内厂商入场,激光雷达价格已出现下探。Velodyne近日也宣布16线激光雷达降价50%,售价仅3999美元。而在2017年,单颗Velodyne的64线激光雷达HDL-64定价近8万美元。理想汽车CEO李想表示,未来自动驾驶的发展更多依靠多传感器的融合,而不是依靠单一传感器。而在马斯克看来,Dojo可以帮助特斯拉实现视觉感知路线,单纯依靠光学摄像机实现自动驾驶,而不是搭载激光雷达进行辅助识别。
卡帕蒂表示,自动驾驶模拟人类的思维对现实场景的判断,基于海量数据对自动驾驶的神经网络进行训练。目前特斯拉搜集的视频数据达到100万个,并对60亿个物体的距离、速度进行标注,数据量达到1.5PB。
天瞳威视一名工程师此前告诉记者,视觉感知的语义识别类似“穷举法”,不同的场景对应不同的判断语句,构成一个庞大的树形图,代码量上和L2和高级别自动驾驶也不是一个量级。一方面,要求收集的数据是干净的,计算机神经网络的训练过程中知道正确的处理逻辑。另一方面,数据也要兼顾特定场景,比如道路两旁的护栏车辆一般不能碰撞,但和宠物狗这类不能碰撞物体同时处理时,栏杆的优先级会降低。
采埃孚集团一名工程师在微信朋友圈评论称,特斯拉超级计算机项目本身并不稀奇,达到1.5PB的有效数据才有价值。
某新势力业内人士表示,其实每一辆车都是一个数据搜集单位,车辆越多、跑的时间越久,所搜集的数据量也越大。特斯拉庞大的车主为其提供海量数据,但各地的道路场景并不太,这也加剧数据处理的工作。
卡帕蒂也承认短期内还无法实现高级别自动驾驶,需要对计算机神经网络进行长期的训练。马斯克在1月份的财报电话会议上表示,将在2021年年底实现全自动驾驶。今年5月,特斯拉向加州机动车辆部门改口称,完全自动驾驶的计划或将推迟。但这仍阻止不了马斯克全自动驾驶的野心,他希望未来特斯拉还将布局Robotaxi,和Waymo等自动驾驶独角兽展开正面较量。