本文作者:访客

理想高管回应王兴质疑,VLA是最佳自动驾驶模型方案

访客 2025-12-10 17:12:48 28993
理想高管回应宇树王兴的质疑,表示VLA是自动驾驶的最佳模型方案,该方案具有卓越的性能和可靠性,能够满足不同场景下的自动驾驶需求,该方案也在不断地进行优化和改进,以适应不断变化的市场和技术环境,理想高管强调,他们将继续致力于推动自动驾驶技术的发展,并为客户提供更加安全、智能和便捷的出行体验。

12月10日消息,在今年8月份的世界机器人大会(WRC)上,宇树科技创始人王兴兴质疑VLA(视觉语言动作模型)的一番言论,引起业界热议。

王兴兴称,对于当前机器人大火的VLA路线,他持有一定的怀疑态度,并直言称这是一个相对傻瓜式的架构。

原因是当VLA模型与真实世界交互的时候,背后的数据质量、数量,并不太够用。

而今日,理想汽车自动驾驶研发高级副总裁@ 郎咸朋在微博发长文,回应了此事。

郎咸朋表示,当时没有提出我的观点,一是理想VLA司机大模型还没正式发布,空口无凭;二是我们对具身机器人行业,还处于密切关注阶段。

我跟王兴兴观点最不一样的地方在于,他认为模型架构更重要,但我认为模型的关键是要与整个具身智能系统适配,在此基础上,数据是起决定意义的。

从今年9月VLA正式发布,到12月6日OTA 8.1的推送,经过两个月多的实践出真知后,我有两点心得:第一,VLA就是自动驾驶最好的模型方案,第二,具身智能最终拼的是整体的系统能力。

郎咸朋称,理想的VLA本质上就是生成式模型,是在用 GPT 的方式做自动驾驶,只不过生成的Token不是文本,而是轨迹和控制信号。

从目前用户使用的反馈看,在某些场景下理想的VLA已经具备了对物理世界的认知涌现。具体表现是用户会越来越多的发现之前端到端没有的拟人行为。

并且,世界模型更适合做考场而不是考生,在自动驾驶领域,脱离了海量真实数据谈模型架构都是空中楼阁,我们之所以坚持 VLA,是因为我们拥有数百万辆车构建的数据闭环,这让我们能在当前算力下,把驾驶水平做到接近人类。

针对具身智能方面,要想做好自动驾驶,必须先把自动驾驶当作完整的具身智能系统对待,每一部分在研发过程中要相互配合才能将价值发挥出来。理想的自动驾驶团队与基座模型、芯片、底盘团队协同打造了整个的自动驾驶系统。

同时,模型的关键是要与整个具身智能系统适配,在此基础上,数据是起决定意义的。在机器人领域获取数据相对困难,但在自动驾驶领域,特别是建立起数据闭环能力的车企来说并不是大问题。

理想不仅可以从过去几年积累的10几亿公里的存量数据里进行挖掘和筛选,更可以通过150万车主的日常使用源源不断的获取新的数据。

此外,李想前两天明确提到,未来五到十年,具身机器人核心将有两种形态:汽车类的具身机器人、人形类的具身机器人。

理想的VLA不仅服务于现在的理想各类汽车产品形态,也将服务于未来的汽车类具身机器人。

理想高管回应王兴质疑,VLA是最佳自动驾驶模型方案

理想高管回应王兴质疑,VLA是最佳自动驾驶模型方案

阅读
分享