观点:特斯拉自动驾驶比Waymo更强?

商业分析人士、记者和普通大众的多数观点似乎是,Waymo在自动驾驶方面遥遥领先,特斯拉则远远落后。然而当你研究神经网络的基本原理时,就会发现,上述观点是没有意义的…

来源:智车科技

决定深度神经网络性能好坏有三个因素:训练数据、网络架构、优化算法。众所周知,深度学习需要大量的数据,而大多数AI领域的工程师,也将大多数时间花在了训练数据上,可见,训练数据是深度学习问题中最核心的一环。一般来说,数据越多,AI越智能,表现越良好。这也是为什么一部分业内人士认为特斯拉优于Waymo的根本原因。

拥有约50万辆汽车的特斯拉车队,配备了特斯拉声称的全自动驾驶硬件,特斯拉车队每天行驶的里程约为1500万英里,相当于Waymo车队成立以来行驶的总里程。根据每天1500万英里的行驶里程,可以推算出特斯拉每年可以行驶54亿英里,比Waymo公司预计的全年行驶里程高出200倍。值得注意的是,特斯拉的车队也在以每周约5000辆的惊人速度不断增长。

这些数据主要在以下三个关键领域发挥重要作用:计算机视觉、预测、路径规划/驾驶策略

  • 计算机视觉

目标检测是计算机视觉的一项重要任务。有些物体,比如马,很少出现在路上。每当特斯拉的汽车遇到神经网络认为可能是马的东西(或者可能只是一个无法识别的物体挡住了路),摄像头就会拍下照片,随后通过WiFi上传。可见,特斯拉让车辆每年行驶数十亿英里是有帮助的,因为这样可以找到更多罕见物体的例子。据此,可以推断,随着时间的推移,特斯拉将比Waymo更善于识别路上的罕见物品。

  • 预测

预测是指提前几秒钟预测汽车、行人或骑行者等交通参与者的运动或动作的能力。多年来一直效力Waymo顶尖工程师之一——安东尼莱万多夫斯基(AnthonyLevandowski)最近称:如今的软件不足以预测未来。Anthony Levandowski称,根据数据显示,目前自动驾驶汽车的故障主要是因为错误地预测了周围的车辆和行人的行为。

目前,特斯拉拥有约50万辆汽车,这是一个非常优越的资源。特斯拉可以利用这50万辆汽车,实现对“错误预测情况”的采集,将采集到的快照上传并添加到特斯拉的训练集中。特斯拉还可以上传一个由其计算机视觉神经网络生成抽象的场景,而不是上传一段视频。这种方式也将从根本上减少上传该数据的带宽和内存需求。

虽然用于训练目标检测的图像需要人类标记,但预测神经网络可以仅从事件的时间序列中学习过去和未来之间的相关性。

由于不需要人为数据贴上标签,特斯拉可以将其神经网络训练成尽可能多的有用数据。这意味着其训练数据集的大小将与其总里程相关。与对象检测一样,与Waymo相比,它的优势不仅在于提供更多的数据来预测常见行为,还在于能够收集在罕见情况下出现的罕见行为的数据,从而预测这些行为。

  • 路径规划/驾驶策略

路径规划和驾驶政策是指汽车在限速时保持在车道中心、变道、超车、绿灯左转、绕过停着的车、停车让行人过马路等等行为决策。要制定一套涵盖汽车在任何情况下可能需要采取的行动的规则,本身极其困难,这也是国内外自动驾驶领域专业人士一直在探讨的问题。解决这一问题的一种方法是利用神经网络复制人类的行为。这就是所谓的模仿学习(也称为学徒学习,或从示范学习)。

训练过程类似于神经网络学习如何通过绘制过去和未来之间的关联来预测其他交通参与者的行为。在模仿学习中,神经网络通过绘制它所看到的(通过计算机视觉神经网络)和人类驾驶员所采取的动作之间的关联来预测人类驾驶员会做什么。

最近,在模仿学习领域炙手可热的明星,不得不提及DeepMind出品的AlphaStar。DeepMind使用了数百万人类参与的《星际争霸》游戏数据库中的例子,来训练神经网络像人类一样打游戏。网络学会了游戏状态和人类玩家行为之间的关联,从而学会了预测人类在面对不同游戏状态时采取的不同动作。仅通过这种训练,AlphaStar便达到了DeepMind估计的水平,使其大致处于《星际争霸》竞争力排行榜的中间位置。后来,AlphaStar通过强化学习提升到职业水平的能力。

同理,特斯拉正在将模仿学习应用到驾驶任务中,比如,如何处理高速公路上常见的立体交叉路况,或者如何在十字路口左转。据外媒报道称,特斯拉会将模仿学习扩展到更多的任务中,比如如何以及何时在高速公路上换车道。特斯拉人工智能总监安德烈·卡帕西(Andrej Karpathy)曾经描述了特斯拉如何使用模仿学习。

与预测结果一样,上传汽车周围场景的抽象表示,而不是上传视频,这表示,神经网络只需要更低的带宽和内存需求就足以供神经网络模仿学习。同样,一旦数据上传,就不需要人为标记。由于神经网络预测人类驾驶员在给定环境状态下会做什么,所以它只需要“给定的环境状态”和“驾驶员动作”即可。模仿学习本质上是预测特斯拉司机的行为,而不是预测特斯拉周围其他交通参与者的行为。与AlphaStar一样,所有需要的信息都包含在回放中。

根据卡帕西关于预测切入(predictingcut-ins)的评论,特斯拉在未能正确预测前方车辆是否会进入特斯拉车道时触发保存回放。类似地,当涉及路径规划或驾驶策略的神经网络无法正确预测特斯拉驾驶员的行为时,特斯拉可能会捕获回放数据。埃隆·马斯克(Elon Musk)过去曾提到过这种功能,不过这种功能的使用情况,尚未得到证实。

其他捕捉回放的情况包括:突然刹车或急转弯、自动紧急刹车、碰撞或碰撞警告,以及更为复杂的机器学习技术,即异常检测和新奇检测。如果特斯拉已经知道它想要捕捉什么,比如十字路口的左转,它就可以设置一个触发器,每当视觉神经网络看到交通灯,左转弯信号被激活,或者方向盘向左转弯时,它就会捕捉回放。

结论

特斯拉拥有约50万辆汽车,在以上三个关键领域相对于Waymo(和其他竞争对手)具有优势。

更重要的是,AlphaStar证明了大规模模仿学习对于复杂任务的概念。有学者认为,如果对特斯拉采用方法的正确性存疑,或者认为路径规划/驾驶策略是一个简单问题的话,那么可以思考一下,为什么模仿学习在《星际争霸》中行得通,在自动驾驶中却行不通。

基于以上分析,有学者旗帜鲜明地表示:除非Waymo在未来1-3年内扩大其车队规模,否则,“Waymo遥遥领先、特斯拉远远落后的观点”将被证实是错误的。人们把太多的注意力放在演示上,可惜这些演示没有表明系统的鲁棒性。人们对训练数据的关注太少,尤其对那些Waymo没有足够的数据来做好基于机器学习的罕见的物体和行为关注更少。

仿真并不是Waymo的优势,因为包含特斯拉在内的所有的自动驾驶汽车公司都在使用仿真。更为重要的是,仿真无法预测或不知道如何准确地对罕见对象和罕见行为建模。

还有一项对科技工作者的调查表明,特斯拉是旧金山湾区第二大最受欢迎的公司,仅次于谷歌。调查还发现,特斯拉在全球最受欢迎的公司中排名第四,比排名第二的谷歌落后两名。(Shopify在全球排名第三,SpaceX排名第一。)同样值得注意的是,机器学习领域的最新科研成果活方法经常被学术界、OpenAI以及谷歌、Facebook和DeepMind的企业实验室公开分享。特斯拉能做什么和Waymo能做什么之间的区别可能不是那么大。

这两家公司最大的不同在于数据。随着特斯拉汽车数量增长到100万辆,其月行驶里程将达到约10亿英里,是Waymo约100万英里的1000倍。对于特斯拉来说,1000倍的差异意味着优越的稀有物体检测,优越的稀有行为预测,以及优越的路径规划/驾驶策略。自动驾驶的挑战更多的是处理可能只有0.01%的罕见的边缘情况,而不是99.99%的通用场景。

参考资料:
[1]
https://towardsdatascience.com/teslas-deep-learning-at-scale-7eed85b235d3
[2] 部分来源于网络其他资料

1条评论

参与评论

请输入你的评论!
请在这里输入你的名字