VLA和世界模型_通往高阶智能驾驶之路——辅助驾驶系列报告二.pptxVIP

VLA和世界模型_通往高阶智能驾驶之路——辅助驾驶系列报告二.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

2025年09月12日

相关报告

《汽车行业专题报告:辅助驾驶的AI进化论:站在能力代际跃升的历史转折点(推荐)*汽车*陈飞宇,戴畅》——2025-07-22

《汽车行业周报:全新问界M724小时小订突破15万台,吉利汽车合并极氪获股东高票通过(推荐)*汽车*戴畅》——2025-09-09

《汽车行业周报:2025成都车展开幕多家车企携新品参展,极氪9X开启预售(推荐)*汽车*戴畅》——2025-09-02

《汽车行业周报:蔚来全新ES8、吉利银河M9开启预售,中大型智能SUV市场迎来重磅新品(推荐)*汽车*戴畅》——2025-08-25

《汽车行业周报:新款问界M7将于9月上市,2025年7月乘用车批发销量同比增长14.7%(推荐)*汽车*戴畅》——2025-08-18

表现1M3M12M

汽车7.1%11.5%55.9%

沪深3009.1%16.2%42.5%

最近一年走势

61%

48%

34%

20%

6%

-7%

2024/09/112025/03/112025/09/11

相对沪深300表现

汽车沪深300

摘要

本篇报告解决了以下核心问题:1、VLA和世界模型是什么及特点?2、目前辅助驾驶产业玩家的路径差异性?3、辅助驾驶能力提升过程中的技术趋势和核心关注点是什么?

一、VLA模型(Vision-Language-Action)

u定义:VLA是一种端到端多模态人工智能架构,通过融合视觉输入(图像/视频)和自然语言指令,直接生成可执行的物理动作,实现从感知、理解到控制的闭环。

u特点:多模态融合-结合视觉语义与语言指令,增强场景理解与交互能力;语义推理与泛化-支持复杂场景的语义推理和长尾问题处理。

u产业玩家:理想汽车-自研MindVLA模型,具备空间理解、思维、沟通与记忆、行为能力四大功能,基于Thor-U/Orin-X平台量产部署,支持语言控制驾驶,于2025年9月OTA全量推送至ADMAX车主;小鹏汽车:采用“VLA+OL”云端基模,通过蒸馏技术部署车端轻量化XVLA模型,于2025年9月OTA推送至G7Ultra;元戎启行-DeepRouteIO2.0于2025年8月发布,搭载自研的VLA模型,已达成5个定点,首批量产车将进入市场。

二、世界模型(WorldModel)

u定义:以视觉与运动数据为基础,通过生成式建模预测环境动态与行为后果,强化辅助驾驶系统在仿真和交互中的可靠性。

u特点:难例场景构建:通过生成式技术增强高密度cornercase的覆盖;时空预测能力-对环境变化和车辆运动进行高精度预测。

u产业玩家:华为-乾崑ADS4.0采用WEWA架构,构建难例场景库,提升泛化能力;蔚来-NWM模型支持多模态输入输出与自然语言交互,强化场景理解与控制;Momenta-R6飞轮大模型采用双模型架构,融合长短期记忆与真实数据闭环。

三、比较与结论:VLA与世界模型在技术上并非同级或对立关系。我们将发展路径分为两派,实质上是产业玩家在实现端到端能力之后,在能力优化侧重点上出现了分化。

u通往高阶智驾的互补路径:VLA侧重语义融合与交互控制,通过语言增强可解释性与用户协同;世界模型侧重环境预测与仿真可靠性,通过生成技术提升安全冗余。

u技术融合趋势明显:双方均在向对方领域渗透:VLA引入强化学习与仿真优化动作生成,世界模型扩展语言交互与多模态理解。

u数据与安全为核心壁垒:数据飞轮效应成为竞争关键-头部车企凭借高活跃用户积累海量里程数据,通过RLHF驱动模型高效迭代;安全性能量化用户体验:当前第一梯队MPA(平均事故里程)已达人类驾驶安全水平的6倍以上,MPI(平均接管里程)持续优化。

行业评级与投资建议:多模态VLA模型引入长序思维能力,世界模型提供仿真与强化训练环境,有效数据闭环+安全能力提升(MPAMPI),共同构筑智能驾驶长期壁垒。考虑到L3辅助驾驶商用标准落地在即,多款L3级架构车型陆续上市,场景切割的阶段性功能实现,并向全场景覆盖的最终愿景发力,维持辅助驾驶行业“推荐

文档评论(0)

哈哈 + 关注
实名认证
文档贡献者

嗨,朋友,我都会用最可爱的语言和最实用的内容,帮助你更好地理解和应对职场中的各种挑战!

1亿VIP精品文档

相关文档