端到端这个名词被玩坏了。我最近看了不少车企的发布会,发现几乎所有的新能源车企在发布会上都会反复提及端到端的概念。比如系统一加系统二,分层端到端,更有甚者提出了端到端世界模型的口号,似乎就差喊出端到端宇宙模型了。这是在忽悠消费者,还是在自我洗脑呢?
端到端自动驾驶这样一个偏学术的专有名词,已经悄然被车企们包装成了一个近乎玄学的营销词汇,而它内在的技术价值、技术特点、技术内核被我们所忽略。那么到底什么是端到端自动驾驶呢?作为消费者,选车、用车、购车时,观察一家车企自动驾驶到底强不强,应该如何去判断呢?特斯拉端到端自动驾驶做得好,具体体现在哪里呢?
今天我们就来聊聊这个严肃且有趣的话题。首先,什么是端到端自动驾驶?
传统的自动驾驶系统通常采用模块化开发策略,将感知、决策和控制等三个主要功能作为独立模块来开发,然后通过规则或者Algorithm+小模型的路径将其整合至自驾系统框架中。这种传统的路线优点明显,简单易行,相对开发难度低,能够在短时间内实现L2甚至L3级别的自驾需求。但模块化的缺点也很明确,各模块需要针对不同目标进行优化,导致系统难以统一,同时部署多个模块也会使系统存在明显的信息损耗,形成资源浪费。
端到端自动驾驶更像是机器自我学习的过程。在学习过程中不再是多层解耦架构,而是基于大模型,通过多头注意力机制,将感知、决策和控制三个模块融合成一个整体,做到实时学习、实时更新。总结一句话就是,端到端追求的是掌握学习方法,在考场中随机应变,而不只是把题目做对。
前者是基于规则的系统,后者则是基于模型的学习系统。在学术上对端到端的定义还有些争议,但可以明确的是,真正的端到端自动驾驶是实时学习和更新的。
我印象最深的是某家车企,因为抖音上一个消费者抱怨家里的自建房无法倒车入库。这家车企派了一个工程师团队进行OTA升级,第二天就能倒进去了。这种现象表明它不是端到端的基于规则的自动驾驶系统。司机常说:“前面有一寸,也不要往后退一寸”。要做到丝滑的倒车入库非常考验车企自驾的真正实力。
自动驾驶从业人员曾表示,从能力上限看,全面转向端到端,企业基本达成统一共识。但具体实现端到端的技术节点、参数量合适度、神经网络层数最优化等问题依然是难题。据我了解,一些公司直接派出团队到北美试驾和分析。特斯拉最新的版本很多地方的体验上有所退步,但是它整体的驾驶感受确实越来越丝滑,像是一个在驾校里真正在学习如何开车的学员。
国内要实现端到端技术依然有挑战。看看车企发布会,不管是什么系统一、系统二,还是分阶段实现端到端,思路本身就有问题,夹杂太多模块化的东西。如果各大车企要往端到端转型,基本上要从顶层框架做调整,算法重建,甚至自驾团队重新构建,不仅需要强大的组织动员能力,还需要极大的决心和资源。像特斯拉有强大的算力和数据中心团队支撑,国内车企要如何调动如此大的算力资源,高层是否有决心投入巨量资源推倒重建?
还有团队和企业文化上的问题。纯视觉路线是否适合?车企习惯跟风,但不能只看别人做过的,而停止创新。比如,激光雷达和新的架构要继续研究,不能陷入思维定式。在思路上我们不能陷入思维的定式,不能一味地只看别人做过的事情,而停止了创新的脚步。
最后和大家来聊聊,目前我们国内车企的自驾水平到底和特斯拉差距有多大呢?说实话在端到端方向上,我们国内车厂们和特斯拉的差距还是相对比较大的。我们要承认这个事实,仅就目前来看,说实话华为做的还是相对比较领先的。我看了一下华为最新的方向,华为乾崑智驾,等于是在架构层面给系统做了一个全向的安全兜底。简单来说,现在华为自驾有点在走端到端加安全强的思路。华为这个思路很有意思,等于是在端到端上面做了一个逻辑伦理上的兜底。不管自驾中出现的任何幻觉问题,起码保证了最基础的一个行驶的安全性。但是理论上端到端模型的约束越少,它的学习自由度越大,整个模型训练的效果也会更好。所以怎么把控这个可控效率以及稳定性的一个具体的平衡点,也是未来自驾系统的一个大的挑战。当下看来,端到端自动驾驶大致是正确的方向。





