99.99%的人类驾驶行为不值得AI学习
“99.99%的人类驾驶行为都不值得学习。”这是地平线创始人余凯在百人会上的原话。它听上去像是一句技术层面的吐槽,但却反映了当前在自动驾驶领域正在变化的现实。
2025-04-01 | 出处: 汽车预言家 | 责编: 谷博文
“99.99%的人类驾驶行为都不值得学习。”这是地平线创始人余凯在百人会上的原话。它听上去像是一句技术层面的吐槽,但却反映了当前在自动驾驶领域正在变化的现实。
这有点像小时候写作业问爸妈数学题,他们告诉你:“我们以前不是这么学的,凑个数差不多就行。”你长大了才知道——原来爸妈是人类智驾系统中的“错误示范集”。
它其实点出了一个正在被悄悄改写的行业共识:自动驾驶,可能真的不再依赖“海量消费级数据”了。
换句话来讲,消费级数据在当前的AI训练下,可发挥的效用正在逐渐的降低。
智能软件算法工程师在接受寰球汽车采访时表示,AI引入智能驾驶训练,真正动摇的是过去十年自动驾驶行业最核心的逻辑:数据是王,量变带来质变,谁数据多,谁能赢。但AI模型进来了,一切都变了。
自动驾驶行业从来都在强调“真实数据”的重要性:哪家跑得久、测得多、覆盖城市广,哪家就能率先进入高阶智驾的正循环。谁先上车,谁先收集数据,谁就领先。可现在,大家突然发现,AI并不想学人类怎么开车。它甚至对人类驾驶行为表现出了一种“天然免疫”。你怎么并线,它不感兴趣;你怎么在红绿灯犹豫,它觉得没参考价值;你有的那些“老司机操作”,它压根不屑一顾。
传统自动驾驶公司(如Waymo)早期依赖海量路测数据,但近年开始转向模型优化和仿真技术。例如:Waymo的仿真系统每天模拟2万+辆车的驾驶,覆盖超过现实路测的场景;特斯拉FSD v12的架构升级,强调“端到端模型”的泛化能力而非单纯依赖数据标注。包括地平线在内的头部公司正投入更多资源在芯片算力和大模型架构上,而非单纯比拼路测里程。
事实上,当前行业头部企业正在采用大规模仿真+大模型训练的路径,用虚拟生成的数据来补齐真实环境中难以覆盖的极端工况。尤其是强化学习与世界模型的结合,使得AI可以在不依赖人类经验的前提下,构建更鲁棒的策略。
最终的结果是:模型性能持续进化,而对真实世界数据的依赖却逐步降低。
准确的来讲,AI不仅不学你,它还想自己搞清楚开车的本质。强大的大模型能在虚拟空间里复现海量场景、生成各种极端工况,然后自己训练自己,自己优化自己。在这个过程中,它变得更稳定、更理性、更快,还不需要被真实世界的嘈杂行为“带偏”。
这就带来一个很现实的问题:过去行业认为的核心竞争力——“我们有数据、我们有路测、我们有销量”——是不是正在失去意义?那种靠真实世界里一点点积累上来的数据壁垒,在AI模型面前,很可能压根就不是壁垒。
就像余凯所讲的:人类训练AI的结果不是用来模仿人类的,而是来超越人类的。
这对车企而言是一次警醒。
尤其是那些通过前期大量投入、建立了数据优势、用户基础的企业,如果还在沿用“用数据跑出来”的旧节奏,可能会在新一轮技术跃迁中被拉平。AI模型的加入,让后来者获得了快速追赶的可能,而曾经积累下来的那堆消费级数据,在模型面前可能毫无增益。
行业观察人士指出,这一变化的实质是,自动驾驶行业正在从“数据堆积逻辑”转向“模型训练逻辑”。在这个阶段,企业的装车量、实车路测公里数、消费级用户数据,不再是技术进展的决定性因素。相反,谁能更快地完成模型结构的迭代、更高效地训练出具备泛化能力的系统,才是真正的竞争力所在。
过去的数据壁垒,正在变得可被绕过。自动驾驶领域所谓的“时间换空间”逻辑,正在被打断。
如果模型足够强,数据就不再稀缺。行业节奏会随之加快,很多原本认为还需要三五年才能拉开的差距,很可能在短时间内被补平。这个过程中,行业竞争的变量会重新洗牌,先发者未必继续领先,后来者也未必没有机会。
这不是对所有人都利好的局面,但它是客观正在发生的现实。