- 1、本文档共14页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
边缘情况合成用于鱼眼物体检测:数据为中心的视角
SeunghyeonKim∗KyeongryeolGo∗
SuperbAISuperbAI
Seoul,SouthKoreaSeoul,SouthKorea
shkim@krgo@
Abstract变技术[43],要么需要专门的模型架构来直接处理畸变
输入。
鱼眼摄像头引入了显著的扭曲,并对在常规数据集上
本为了解决这一问题,组织了第九届AI城市挑战赛,
训练的对象检测模型提出了独特的挑战。在这项工作
译中,我们提出了一种以数据为中心的流水线,通过集中以促进在不同交通条件下使用鱼眼相机进行实时目标
检测的研究。该挑战采用F1分数和推理速度(FPS)
中解决识别模型盲点的关键问题来系统地提高检测性能。
的调和平均值作为评估指标,鼓励参赛者在准确性和
1通过详细的错误分析,我们确定了关键的边缘案例,例
v计算效率之间取得平衡。强制要求模型在JetsonAGX
4如混淆类对、周边扭曲和代表性不足的情况。然后我们Orin边缘设备上的性能至少达到10FPS,以确保模型
5直接通过合成边缘案例来解决这些问题。我们将图像
2的实际部署性。
6生成模型进行了微调,并使用精心设计的提示引导它
1.生成复制现实世界失败模式的图像。这些合成图像是此次挑战提供的数据集,FishEye8K[13]和Fish-
7使用高质量检测器进行伪标记并整合到训练中。我们Eye1Keval,包含为五类交通对象标注的鱼眼图像:公
0交车、自行车、汽车、行人和卡车。该数据反映了广泛
5的方法带来了持续的性能提升,突显了如何深入理解
2的交通场景,包括不同的拥堵水平、各种道路几何形
:数据并通过有选择地修复其弱点在像鱼眼对象检测这
v状如交叉口以及一天中不同时间和观察角度下的多样
i样的专业领域产生影响。
x化照明条件。数据集被划分为5,288张训练图像、2,712
r
a张验证图像和1,000张测试图像。
1.介绍对数据集的分析显示,一天中不同时间段存在显
著不平衡。值得注意的是,下午类别在训练集中占主导
边缘AI在交通监控和智能移动应用中的日益部
地位,而晚上样本则完全缺失。夜间和早晨的数据虽然
署,使得由于其宽视角(FoV)特性,鱼眼相机重新受
存在,但每个场景仅限于一台摄像机,这表明场景多样
到了关注。与传统的透视相机相比,鱼眼相机可以覆盖
您可能关注的文档
- ACT:通过合成数据生成及自适应训练弥合代码翻译差距-计算机科学-软件开发-代码翻译-自动训练框架.pdf
- 自适应贝叶斯单次量子传感-计算机科学-机器学习-量子传感-量子信道.pdf
- 通过补丁级图聚类和混合密度专家从整张幻灯片图像进行生存建模-计算机科学-深度学习-注意力机制-组织病理学.pdf
- MMS 播放器:一个用于手语角色参数化数据驱动动画的开源软件-计算机科学-合成手语动画-机器学习-开源软件.pdf
- 一种在大型语言模型(LLM)驱动的应用程序环境中衡量自动语音识别(ASR)模型性能的方法-计算机科学-机器学习-自动语音识别-人机交互.pdf
- 探索大型语言模型在分析和改进科学代码中的方法名称方面的应用-计算机科学- AI自动化-程序理解-大语言模型.pdf
- 具有噪声伪标签学习的鲁棒半监督医学图像分割使用扩散模型-计算机科学-半监督学习-扩散模型-医学图像分割.pdf
- 改进高度不平衡数据上的预测 使用开源合成数据过采样附和-计算机科学-预测建模-人工智能-合成数据.pdf
- GG-BBQ:德国性别偏见问答基准测试-计算机科学-大语言模型-自然语言处理.pdf
- 二部患者模态图学习与事件条件下的删失建模用于癌症生存预测-计算机科学-机器学习-监督数据-即插即用.pdf
- eX-NIDS:利用大型语言模型的可解释网络入侵检测框架-计算机科学-大语言模型-网络入侵检测系统.pdf
- LLM 增强的重新排序用于互补产品推荐-计算机科学-大语言模型-图神经网络-机器学习.pdf
- 基于图的双曲率结构设计算法分析及平面六边形面板的制造-计算机科学-计算设计-生成算法-平面化制造.pdf
- 使用史瓦西度量进行黑洞图像的并行光线追踪-计算机科学-并行编程-数学近似.pdf
- 可穿戴设备的设计与优化以收集人体运动能量-计算机科学-人工智能-可穿戴电子设备.pdf
- Nd3+ 掺杂诱导的高温下 0.7BiFeO3-0.3BaTiO3 无铅压电陶瓷漏电流抑制-计算机科学-铁电极化.pdf
- 资源受限边缘环境下的轻量级对象检测系统的设计与实现-计算机科学-深度学习-微控制器设备-计算机视觉.pdf
- SDBench:一套全面的说话人分离基准测试套件-计算机科学-人工智能-说话人分割-设备端推理.pdf
- 税算基准:在税收计算任务上评估前沿模型-计算机科学-人工智能-税收计算-大语言模型.pdf
- MLRU++: 带注意力机制的多尺度轻量级残差 UNETR++用于高效 3D 医学图像分割-计算机科学-深度学习-神经网络-高性能.pdf
文档评论(0)