汽车行业智能驾驶系列报告二:特斯拉FSD,智驾全栈自研,开启宏图新篇.docx

汽车行业智能驾驶系列报告二:特斯拉FSD,智驾全栈自研,开启宏图新篇.docx

目录

引言 3

概览:软硬件全链路闭环全栈自研构筑强大技术基石 5

发展历程:软硬件持续迭代由外部合作到全栈自研 5

系统架构:软硬件全链路闭环实现高度集成 6

算法端:创新算法优化实现高效神经网络推理 8

感知:先进感知技术,确保精准环境理解和物体识别 8

规划:采用交互搜索框架快速选择最优方案 18

算力端:Dojo超级算力支撑保持能效比优势 21

Dojo系统:特斯拉自研超算平台研发进展迅猛 21

D1芯片:基于存算一体架构实现高效数据传输 24

瓦片集群:由基本单元出发构成大规模算力集群 26

软件系统:采用高效同步机制性能较GPU大幅提升 27

芯片端:自研FSD芯片集成高效计算能力 30

硬件架构:由合作迈向自研运算性能强大 30

编译推理:高效优化最大化计算资源利用 34

数据端:自动化数据闭环优化数据驱动训练 36

自动标注:自动化4D标签生成提升标注效率 36

仿真模拟:构建虚拟场景优化算法表现 39

数据引擎:集成多源数据加速模型训练 42

端到端架构:FSDV12引领实现感知决策一体化 46

特斯拉的AI关键时刻:FSDV12首次实现端到端V13即将推出 46

大模型成就端到端自动驾驶推动感知决策一体化 48

端到端架构演进:感知端到端到OneModel端到端 49

投资建议 51

风险提示 52

插图目录 53

表格目录 54

引言

本报告为特斯拉FSD专题报告,从算法端、算力端、芯片端、数据端四个层面出发,对FSD系统底层技术原理进行全面深度拆解,并结合端到端架构演进趋势,对FSD系统的最新发展变化进行梳理,对板块后续核心催化进行展望。

FSD是一套包含感知、规控、执行在内的全链路自动驾驶软硬件架构,在算法、算力、数据、芯片等层面实现了高度集成:

1)算法端:感知规划算法全栈自研,实现从纯视觉信息输入到规划方案输出。

感知。特斯拉采用BEV+Transformer架构,将2D图像转化为对周围环境的准确3D感知。而后,特斯拉将该架构升级为OccupancyNetwork,能够直接在向量空间产生体积占用,精准识别物体运动状态差异;2)规划。特斯拉采用交互搜索框架,以任务分解的方式对一系列可能的行驶轨迹进行研究,实现对规划方案的实时评估。通过算法端全栈自研,特斯拉以低成本感知硬件进行高阶智驾能力输出,快速实现自动驾驶算法优化迭代。

算力端:从0到1构建超级计算机系统,为远期算力提供强大支撑。特斯拉从算力芯片开始,完整构建Dojo超级计算机系统,以处理自动驾驶所需海量数据。2021年8月,Dojo在特斯拉首届AIDay上正式亮相,定位为超高速训练计算机,采用分布式计算架构设计,算力分为内核级、芯片级、格点级、集群级等四个层级,实现从训练节点到训练集群的完整构建。特斯拉从0到1构建超级计算机系统,旨在摆脱对英伟达GPU的依赖,为远期算力瓶颈进行前瞻布局。

芯片端:由合作迈向自研,实现高性能算力集成。特斯拉自动驾驶硬件平台初期与Mobileye、英伟达等合作,2019年正式发布基于自研FSD芯片的HW

3.0系统,开始转向硬件平台全面自研,下一代全自动驾驶(FSD)硬件——AI5,预计将于2025年下半年投产。FSD硬件计算平台采用两颗SoC芯片,以双系统设计提升自动驾驶功能安全冗余。特斯拉构建了神经网络编译器与链接器,以最大化计算资源利用率、吞吐量,并最小化延迟。通过芯片自研,特斯拉能够实现硬件方案的持续快速迭代,与软件算法进行更好的整合,从而实现更优的系统性能。

数据端:高效自动标注+构建仿真场景,实现数据驱动训练。2020年,特斯拉开始研发并使用数据自动标注系统,能够在12小时内自动标注一万个驾驶旅

程,可抵充500万个小时的人工标注工作,极大提高了标注效率。仿真模拟则可以提供现实世界中难以获得或是难以标记的数据,从而加速FSD能力的训练,赋能模型迭代。结合真实数据和标签,以及仿真和手动校准的数据,特斯拉形成综合训练数据集,用于训练车端的在线模型,涉及网络占用、车道线和障碍物检测以及规划算法,形成闭环的数据流,实现自动驾驶系统的持续优化。

FSD技术端快速进化,V12为首个端到端自动驾驶系统,能够模拟人类驾驶行为,实现感知决策一体化。特斯拉FSDv12于2023年底推出,采用端到端大

模型,消除了自动驾驶系统的感知和定位、决策和规划、控制和执行之间的断面,将三大模块合在一起,形成了一个大的神经

文档评论(0)

1亿VIP精品文档

相关文档