This is all nets baby. Nothing but nets.(这全都是神经网络,除了神经网络再无其他。)
在开播不久之后,顶流主播马斯克,在直播中对 FSD Beta V12 做出了这一句概括。
是的,马斯克最近开了一场直播,向大家演示尚未正式发布的 FSD Beta V12 在路上的实际表现。
与之前的 FSD Beta 不同的是,FSD Beta V12 是首个完全基于神经网络的端到端自动驾驶,换句话说,这是真正意义上的「由 AI 来开车」。
尽管出镜发言早就驾轻就熟,但马主播显然对开视频直播这件事有点生涩。
在出发之前,他还在思考应该选择横屏还是竖屏这样的入门级问题。在直播过程中,横屏与竖屏不断切换,没有固定支架支撑的画面频繁抖动,手指甚至一度挡到了镜头。
单从直播观感来说,这确实属于门槛都没摸到。
就是这样一场画质堪比十年前,画面频繁抖动旋转,主播有一搭没一搭的聊着天,甚至开播时还有些腼腆的直播,当下已经有了高达 1100 多万的播放量。
伴随着直播的进行,马斯克一边让 FSD Beta V12 操控车辆,一边进行旁白介绍,不断夸赞 FSD Beta V12 驾驶的平稳与 Model S 的舒适。
而最为重要的是,在长达 45 分钟的直播中,FSD Beta V12 仅有唯一一次的人为接管,在其余的时间内,它的驾驶风格,与常人无异。
马斯克曾经表示,FSD V12 将会摘掉 Beta 也就是测试版的头衔,那么 FSD,准备好了吗?
在直播的一开始,马斯克的这台 Model S 就遇见了一个非常规的路面状况——路面因为施工而临时改道,工人用立柱在原道路上规出了一个新路线。
但 FSD V12 没有丝毫犹豫,以并不算低的速度轻松沿着新线路穿越,马斯克一边介绍:「它(这台 Model S)从未见过这种路面结构」。
在 45 分钟的直播里,马斯克不断强调,FSD V12 没有用任何一行代码告诉机器:你需要沿着新的临时道路行驶,需要在减速带前减速,遇到骑车的人要避让,需要先来后到,红灯停绿灯行……
唯一要做的,就是通过大量的行驶视频,让 FSD「悟」到规则。
而在 FSD Beta 11 中,有超过 30 万行的代码,从而实现对 FSD 的行为控制。
在直播的中段,FSD V12 在一处红绿灯路口识别错了灯号,错将左转绿灯看成了直行绿灯,起步行驶,被马斯克一脚拦下。
马斯克尴尬笑笑,表示我们会用更多的红绿灯视频交给 FSD 查看,来解决这个问题。
看错灯号,错得倒是很「人类」。
▲ 认错的红绿灯
除了这一次的人为干预之外,FSD V12 在直播中再无明显失误,变道、跟车、甚至是在红灯排队时,都会选择两条车道中队列较短的那一条,简而言之,一切都很「人类」。
这期间,马斯克甚至不忘与扎克伯格的拳击赌约,直接搜索了疑似扎克伯格的住址(最终被证明地址并不对),让 FSD V12 操控车辆前往。
▲FSD:这条道快啊!
而这一操作也从侧面证明了,这一次 FSD V12 走的并不是直播前就规划好的既定路线,而是实打实的「指哪打哪」。FSD V12 带着马斯克和屏幕前的千万观众们,一起在加州硅谷的帕洛阿尔托惬意的兜了 45 分钟。
但,尽管从直播来看,FSD V12 几乎尽善尽美,不少人还是发现了问题——这个路况真是对 FSD 太友好了。
首先,即便是在马斯克口中的周五下班晚高峰时段,帕洛阿尔托的车流也真算不上多,至少肯定没到咱们这能称为「拥堵」的级别,更不存在需要频繁变线,见缝插针,不然就会错过下一个路口的拥挤路况。
即便如此,FSD V12 在面对斑马线上的行人时还是极其谨慎,以至于「不太敢动」,听得出来,马斯克也觉得 FSD V12 有那么点磨唧了。
在帕洛阿尔托,没有随处横穿马路的行人,也没有突然从盲区窜出的摩托车/自行车。就连见惯了宽阔少车路面的美国网友也表示,该给 FSD V12 上上强度了,这种路况,根本不够看。
此前,已经有不少车主将 FSD Beta V11 带到了纽约曼哈顿这一同样以拥堵和难开闻名的地方,FSD Beta V11 虽然也能通过,但在流畅性上相比人类驾驶员还是有些差距。
马斯克也表示,正因为各地路况不同,所以特斯拉也需要在世界各地的数据来训练 FSD,从而应对不同的天气条件和拥挤程度。
当然了,盯着马斯克这轮直播的,肯定不只有吃瓜群众,还有各大车企的智驾团队。
在评论区就有人指出,诸如小鹏、蔚来、华为等等在智驾领域有所建树的人肯定会关注这场直播,而这些品牌也将会成为特斯拉的对手。
对于这一点,马斯克的观点是特斯拉有自己的硬件基础,再有与之相容的软件,如果只有算法,缺少硬件匹配,依然难以成功复制。
强大的硬件和全球各地庞大的车队,才是 FSD 真正的底气来源。
另外,也有不少人并不看好 FSD V12 的真正表现,毕竟在 FSD V11.4.x 这一系列的版本中,特斯拉都没能完全解决诸如车道偏离的问题。先前的坑尚未完全填补,新的大饼又扑面而来,FSD V12 的表现究竟如何,光靠马斯克一个直播,还很难盖棺定论。
FSD V12 之所以引人关注,马斯克之所以开直播宣传,归根到底,是因为改变了实现智驾的手段。
简单来说,就是将大量的驾驶实例视频交给 FSD 学习,而 FSD 在阅读了庞大的视频数据后,会发现一个共性:
「只要前面有红灯亮起,大家就都会在白线后停车。」
于是 FSD 由此学习了「红灯停绿灯行」这一法则,这是 FSD 自我学习的成果,而非人类告诉它的标准答案。这便是神经网络,或者用一个更为通俗的词——AI。
通过学习大量真实驾驶员的驾驶行为,来习得自动驾驶,这是一个由新司机向老司机转变的过程,开得越多,见的世面当然也就越多,积累经验,成就大我。
与人类不同的是,FSD 可以吞噬海量内容,再从中学习,这个效率,相比大多数只在上下班通勤的打工人来说,可要高得多了。也就是说,FSD 见得多了,完全有可能比人类驾驶员开得更好,做出更好的决策。
与之不同的是,目前的主流辅助驾驶(包括 FSD Beta V11 版本),更多依靠的是基于规则的代码,约等于直接告诉系统:你应该在两条白线之间行驶,遇到红灯要停车。
这就像是一个认真听讲,但不太有发散思维的学生,老师教的全都会,一旦遇到老师没教过的,可就不好说了。
可以说,这是两种不同的方法,一种是给到正确答案,照做就行,另一种则是给到解题思路,再举一反三。
但神经网络也非十全十美。
神经网络通过学习人类司机开车的画面来学习,问题在于,在你的成长过程中,总不免会碰到一些可能会将你「带偏了」的坏人,而 FSD 面对的,则是一些不守规矩的人类司机,演示的驾驶陋习。
在直播过程中,坐在副驾的工程师就提到,在美国,只有 0.5% 的驾驶员会在停止标志前完全停下车,而绝大多数人会选择慢速通过。
然而监管部门会要求智驾系统必须在标志前完全停住,为此,特斯拉需要专门「教导」FSD,提高正确操作画面的权重,让它「学点好的」。
马斯克提到,在这样的模式下,数据质量很重要,品牌需要确保输入的数据都是良好的驾驶数据,而管理数据也会带来不小的成本。
而依靠代码限制的智驾系统,尽管在面对未知情况时容易「手足无措」,但只要在能力范围之内,按部就班的能力则更为靠谱且可控。只要给到足够多的规则,智驾「乖乖听话」执行便是。对于车企而言,这样的做法在风险上更为可控。
另一个值得考量的问题是成本。
马斯克提到,特斯拉每年在 FSD 上的投入高达 20 亿美元,这无疑是一个烧钱生意,也是采用神经网络所需要的成本。而对于其他仍挣扎于利润的车企来说,掏不掏得起这个钱,是摆在面前躲不掉的话题。
当然,终局未到,智驾的正确答案,或许不止一个。但可以确定的是,马斯克治下的特斯拉,一直都是那个更为激进,也更有能力激进的品牌。
实际上,就连马斯克本人,也无法确定,FSD V12 是否拥有足够惊艳的表现,在开场的第一个左转红绿灯等待时,马斯克就笑说:希望它别卡在这。
但 FSD 是否在路上卡住,并不是太重要,至少尴尬程度比在发布会上演示 Cybertruck 玻璃硬度,却亲手将车窗砸碎要轻得多。
更重要的是,FSD V12 为我们描绘了一个全新的智驾研发路线,更为我们演示了 AI 的思考逻辑。「像人类一样思考」,它的潜力,有无限可能。
回到眼前,据传将在明天也就是 9 月 1 日正式亮相的新款 Model 3,究竟会带来多少创新,更是让人兴奋。