行情中心 沪深A股 上证指数 板块行情 股市异动 股圈 专题 涨跌情报站 盯盘 港股 研究所 直播 股票开户 智能选股
全球指数
数据中心 资金流向 龙虎榜 融资融券 沪深港通 比价数据 研报数据 公告掘金 新股申购 大宗交易 业绩速递 科技龙头指数

VLA模型崛起 汽车行业迎智驾与智造双破局

中国证券报 2025-08-02

纵观智能辅助驾驶技术的发展历程,人工智能的不断突破显著提升了智能辅助驾驶的感知性能。从卷积神经网络(CNN)的引入,到循环神经网络(RNN)的应用,再到结合鸟瞰图(BEV)与Transformer(自注意力机制的神经网络架构)的创新,再到当下的端到端结合VLM(视觉语言模型)统揽全局,AI不断改善出行体验。

时至今日,智能辅助驾驶技术和体验的变革,正在迎来更大的机遇,甚至将迅速改写以往的竞速规则。自今年开始,一种全新的技术范式正在开启落地,头部玩家有了爆款证明,引领行业跟进对齐,隐隐成为共识趋势。这种技术范式就是视觉语言动作模型(VLA,Vision-Language-Action)。

特斯拉在2023年宣布FSD BetaV12(完全自动驾驶测试版)全面转向端到端架构时,行业首次意识到,传统“感知-决策-控制”的模块化体系正在遭遇颠覆。随着VLA模型的出现,将这场变革推向了更深维度——这种融合视觉、语言理解与行动决策的AI架构,拥有更高的场景推理能力与泛化能力,正在重新定义智能辅助驾驶的底层逻辑。据此,不少智驾人士都将VLA视为当下端到端方案的2.0版本,2025年则被称为“VLA上车元年”。

而在汽车制造方面,AI同样发挥着巨大作用。从辅助工人操作的智能提醒,到跨系统自动协同的智能执行,再到自主优化流程的智能进阶,AI正驱动汽车制造从传统的流水线,向高效协同、自主优化、数据驱动的“智能岛”范式跃迁。

VLA模型受推崇

事实上,VLA模型最早见于机器人行业,通过输入给定的文本和视觉数据,输出机器人可执行的动作,天然便带有AI与物理世界交互的基因。2023年7月28日,谷歌DeepMind推出了全球首个控制机器人的VLA模型。如今这一模型概念正快速扩散到智驾领域。

过去,智能辅助驾驶行业基于规则算法,进行了十余年的艰辛探索。近两年,特斯拉引领的End-to-End(端到端)智能辅助驾驶,成为新的技术方向。配合端到端技术,行业玩家增加语言模型等来提升智驾能力上限,端到端+VLM一度被众多主流公司推崇。

然而,随着越来越多新能源车型NOA(城区导航辅助驾驶)的普及,用户对智能辅助驾驶体验的需求正从“能用”转向“好用”。尽管传统VLM或端到端方案在感知与决策方面有了显著提升,但在复杂路况下仍存在局限,其中包括路况推理短视化、缺乏解释能力和决策全局性不足等问题。

但不同于VLM相对独立、低频地为端到端提供驾驶建议的模式,在VLA架构下,端到端与多模态大模型的结合会更彻底,VLA成为新一代“端到端+VLM”的结合体,并有望快速赶超并取代前者。

中国自动驾驶产业创新联盟调研员高超表示,VLA的核心突破在于其“世界模型”构建能力和“思维链”的推理能力。VLA可以从传感器数据中提取丰富的环境信息,借助语言模型理解人类指令并生成可解释的决策过程,最后将多模态信息转化为具体的驾驶操作指令,真正推动智能辅助驾驶从“功能时代”迈向“体验时代”。

“VLA有可能在未来两年内改写智能辅助驾驶市场的竞争格局。”在高超看来,VLA则将端到端与多模态大模型更彻底地融合,能够根据感知直接生成车辆的运动规划和决策,更接近“图像输入、控制输出”的端到端智驾理想状态,而由此带来的技术路线的分野也在引发产业链价值重估。

根据高盛最新报告,到2030年,VLA主导的端到端方案可能占据L4级市场60%份额,这意味着传统一级供应商(Tier1)的价值链地位面临重构。

电车巨头特斯拉成为这场变革的潜在受益者,这也在近期备受关注的一次测试成绩中得到体现。公司CEO埃隆·马斯克在2024年二季度财报会议上透露,FSDV12的干预频次较V11下降76%。

在此背景下,国内车企和智驾玩家也开始暗自发力。在7月29日举行的理想汽车发布会上,公司CEO李想动用大量篇幅,深入解读了VLA司机大模型的关键作用和创新训练方法。“VLA将开启人类智能的崭新时代,i8将成为第一款搭载VLA司机大模型的理想车型。”李想表示。

作为“车位到车位”的提出者,华为通过智驾3.0融合GOD(通用障碍物检测)网络与VLA模型,在无高精地图区域实现厘米级定位;百度Apollo则依托文心大模型,将VLA的交通场景理解准确率提升至98.7%。

为此,传统供应商巨头选择合纵连横,多线押注。博世与微软合作开发车用Copilot通用软件系统,试图将VLA能力注入现有域控制器;大陆集团则斥资4亿欧元收购AI初创公司Recogni,强化边缘计算端的视觉处理能力——“双轨战略”折射出行业过渡期的典型特征:既要守住现有市场份额,又不甘错过技术范式转移的窗口期。

“VLA引发的技术地震正在重塑智能辅助驾驶产业格局,这场变革的终局或许不是某条技术路线的完胜,而是催生出分层市场。”中国乘用车产业联盟秘书长张秀阳认为,VLA技术的应用不仅推动了企业在相关技术研发上的投入,还促使整个行业重新审视和制定相应的标准与规范。

张秀阳对中国证券报记者表示,在Robotaxi(无人驾驶出租车)领域,混合运营架构(有人+无人)可能长期共存;而在量产车市场,未来VLA模型有望成为高阶智驾的新标配。这不是单纯的技术竞赛,而是整个汽车和智能辅助驾驶行业认知范式和技术范式的迁移。“当软件定义汽车进入2.0时代,真正的较量才刚刚开始。”

AI助力汽车制造范式跃迁

智能辅助驾驶之外,AI对汽车行业的制造还体现在流程优化和智能制造上。

提到汽车制造,人们最先映入脑海的就是“冲压、焊装、涂装、总装”四大工艺流程,实际上在汽车工业百余年历史中,汽车制造方式并非一成不变,而是伴随着科技的进步始终在不断进化迭代。

记者观察到,传统汽车流水线模式弊端日益凸显,换产耗时长,产能爬坡慢,质量波动大,产能不达标,更加无法应对小批量、多批次的定制化订单。

神州数码首席信息官李晨龙在接受中国证券报记者采访时表示,传统的信息化建设,如上马MES(制造执行系统)、ERP(企业资源计划)等,往往是直接套用了系统的流程,导致当把一个个应用系统拼在一起的时候,就会发现企业端到端的流程并不能很好地在这些系统串起来。这种源于设计与执行的根源问题,使得流程中产生的数据质量难以保证,成为AI深度赋能制造的巨大障碍。

同时,汽车制造的复杂性和长价值链使得全面、自上而下的AI变革成本高昂,决策困难。李晨龙表示,面对这一挑战,“AI for Process”和“Twin-Drive(TD)双驱动模型”为汽车制造业提供了破局之道。对于拥有清晰数智化战略且具备一定基础的大型主机厂,可采用自顶向下的方法,保证AI应用场景的全面覆盖,避免出现场景遗漏或执行断点,确保各场景间形成有机串联,构建起完整的AI流程生态。

“以合作过的汽车客户实践为例,他们最多就是用到IPD流程(集成产品开发)。我们要做的是端到端地把整个IPD流程给详细解码出来。通过流程梳理,确保Agent(智能体)是在一套流程上工作。通过将IPD流程分解到更细层级的业务活动,并在其中精准定义AI场景。”李晨龙表示。

李晨龙告诉记者,汽车行业对AI for Process理念的接受度很高。“我们沟通达到一定层级的时候,企业的高层普遍非常认可。虽然全面铺开存在挑战,但聚焦关键流程或局部环节的AI赋能已经显现成效。”他预测,随着AI在制造流程中的渗透率不断提升。未来,哪家车企的AI渗透率更高,谁的发展就会更快。

免责声明:用户发布的内容仅代表其个人观点,与九方智投无关,不作为投资建议,据此操作风险自担。请勿相信任何免费荐股、代客理财等内容,请勿添加发布内容用户的任何联系方式,谨防上当受骗。

举报

相关股票

相关板块

  • 板块名称
  • 最新价
  • 涨跌幅

相关资讯

扫码下载

九方智投app

扫码关注

九方智投公众号

头条热搜

涨幅排行榜

  • 上证A股
  • 深证A股
  • 科创板
  • 排名
  • 股票名称
  • 最新价
  • 涨跌幅
  • 股圈