学习理财博客空间

理财鱼

您现在的位置是:理财鱼 > 理财方法 >

理财方法

特斯拉自动驾驶的底层逻辑

发布时间:2021-08-26 12:29理财方法 评论

如果机器人有大脑,会是什么样?

在科幻电影《机械姬》里,全球最大搜索引擎公司“蓝皮书”CEO纳森向观众展示了自己发明的机器人大脑,并留下这么一句话:“人们认为搜索引擎是人们思考的事物,但其实那是人们思考的方式。”

特斯拉自动驾驶的底层逻辑


该影片上映于 2015 年,被誉为人工智能爱好者必看的电影之一,拿下包括奥斯卡金像奖在内等多项国际电影大奖。 但在众多奖项 中,单项之冠是 “ 最佳女配角 ” ,艾丽西卡 · 维坎德,也正是影片中智能机器人 “ 艾娃 ” 的扮演者。

“艾娃”是纳森给“她”取的名字,为制造出能独立思考的人工智能,纳森利用自家搜索引擎“蓝皮书”的算法来构建艾娃大脑的“思维”,使之学会人类思考方式。

无独有偶,想让机器有人类思维,同样见之于特斯拉打造的自动驾驶AI上。2019特斯拉自动驾驶日上,安德鲁·卡帕西 (Andrej Karpathy,特斯拉AI总负责人) 曾明确地向大众传达特斯拉自动驾驶是在模仿人类驾驶,因为现行的交通系统是基于人类视觉和认知系统来设计的。

由此,特斯拉开发出“人工神经网络”,并利用大量有效的行车数据来训练它,在这一过程中不断完善并迭代视觉算法,终于在今年年中拿掉毫米波雷达,而随着超算Dojo浮出水面,长期被诟病只能算辅助驾驶的特斯拉,离真正的自动驾驶又近一步。

从学会开车,到比人类更懂开车、开得更好,当一名优秀的“老司机”,是特斯拉自动驾驶持续优化的底层逻辑。

01 “云端司机”的神经网络

纯视觉自动驾驶方案是特斯拉的独门绝技,但需建立对计算机视觉深度训练之上。

计算机视觉是一种研究机器如何“看”的科学,当人类看到一张图片时,能清晰辨析图片里的事物,比如说美丽的风景照、或者一张小狗的照片,然而计算机看到的却是像素 (pixel) ,像素是指由图像的小方格组成的,这些小方块都有一个明确的位置和相对应的色彩数值,计算机“记住”的就是这堆数字字符,而不是具体事物。

如果想让计算机能像人类一样快速准确识别出图片里的事物,机器也有了人工大脑,来模拟人脑处理加工图像信息过程,分为输入层、隐藏层、输出层,里面有许多人工神经元,可视作人脑初级视觉皮层中的锥体细胞和中间神经元。

整个训练过程亦可类比小孩看图识物,通过一次次输入、对比、纠正,完成机器图像认知。通常在训练初期,人工神经网络识别结果的准确度非常低,输出结果和实际值相似度可能只有10%;为了提高准确度,需要再将两者误差从输出层反向传播至输入层,并在反向传播中,修正神经网络隐藏层的参数值,经过上百万次的训练,误差逐渐将收敛,直至输入和输出端匹配度达到99%。

特斯拉自动驾驶的底层逻辑


上述过程是理解特斯拉自动驾驶AI的关键,只不过特斯拉开发的人工神经网络专注于驾驶领域,做一名专职云端司机。对它来说,最好的学习材料就是行车数据,大量、多样化、来自真实世界的驾驶训练数据集 (training dataset) 是自动驾驶AI能应对各种路况、交通问题的百宝书。

在影子模式的支持下,特斯拉全球百万车队每时每刻的行车数据都成为这位云端“老司机”提升自身驾驶能力的养分。时至今日,特斯拉Autopilot已经能瞬间完成道路上各种动静目标、道路标识、交通符号的语义识别,反应速度甚至比人脑条件反射更快。

特斯拉自动驾驶的底层逻辑


除了应对日常驾驶场景外,AI司机还需要处理一些较为少见的长尾情况 (Corner cases) 在2020年Matroid机器学习大会上,卡帕西以交通指标STOP为例,讲解Autopilot应对这些长尾情况的具体方法。

在日常驾驶过程中,车辆总会经过形形色色的STOP指标,最为正常的情况就是一个立在路旁或者路中、红底白字的STOP标识,但现实生活总会有些预料之外的情况发生,驾驶员偶尔会碰上一些奇奇怪怪、需要结合具体背景来理解意涵的指标,包括不限于以下:

无效STOP指标,比如被某人拿在手上,却无意义;下方附带文字说明的STOP指标,比如不限制右行;STOP字母被树枝、建筑物遮挡的指标…这都是些出现频次不高却不胜枚举的情况。

遇到上述情况,人类驾驶员可以轻松识别出绝大部分情况下的“STOP”,并很快作出行动反应。但对计算机来说,情况就变得复杂起来,毕竟它看到的不是具体的"STOP",而是一堆无意义的数字代码,如果遇到现有训练数据集中没出现的情况,比如一些上述奇奇怪怪、较为少见的指标,自动驾驶神经网络就不能处理。

特斯拉自动驾驶的底层逻辑


这部分少见的长尾数据通常无穷尽,但又必须在尽可能短的时间内学会应对,如果一切都让人工操作,无疑需要耗费巨大的时间成本和资源。尽管在8月20日AI大会上,卡帕西透露目前特斯拉标注团队规模已达千人级别,但在海量行车数据面前,千人还是显得杯水车薪,对此特斯拉内部开发了数据离线自动标注 (Data Auto Labeling) 以及自动训练框架“数据引擎( Data Engine )”。

特斯拉自动驾驶的底层逻辑


首先,特斯拉神经网络团队在对这些长尾情况有所了解后,会先编成一个样本数据集,并为此创造一个局部小型神经网络来学习、训练 (与其他神经网络并行) ,通过OTA方式部署到全球英语地区特斯拉车辆上。

共3页: 上一页下一页

>相关《特斯拉自动驾驶的底层逻辑》内容:


1、 特斯拉宣布到2025年将电动滑板车和充电站带到商店

TeslaPower USA在新德里 Aerocity 的 Pride Plaza 酒店举办了印度商务会议。 参加该计划的有医学博士兼全球首席执行官 John H. Vratsinas、印度董事总经理 Kavinder Khurana 和印度业务主管 Sandeep Avasthi。 我们正准备在不久的将来在我们特许经营的特斯...【继续阅读】


2、 特斯拉Model 3座椅出现鼓包 官方:非制造缺陷 维修需1.2万元

理财鱼小提示:特斯拉Model 3座椅出现鼓包 官方:非制造缺陷 维修需1.2万元 近日,有媒体报道,海外某特斯拉车主爆料称,自己的Model 3出现了座椅鼓包现象。 据该车主介绍, 出现座椅鼓包情况的特斯拉Model 3总行驶里程约1.05万公里,该问题是经历了几周炎热天气...【继续阅读】


3、 凌晨噩耗!常州特斯拉坠河,夫妻均已遇难!

理财鱼小提示:凌晨噩耗!常州特斯拉坠河,夫妻均已遇难! 12月24日中午12时,一辆特斯拉轿车冲撞江苏常州溧阳市区新城桥护栏后坠河,车上乘坐的两人是夫妻, 丈夫于24日抢救无效身亡,妻子则在抢救中。 12月25日晚,极目新闻记者采访获悉, 坠河的妻子已于25日...【继续阅读】