- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
ICS25.040.99
CCSl66
SAIAS
上海市人工智能行业协会团体标准
T/SAIAS018—2025
代替:T/SAIAS018-2024
具身智能语料库建设导则
ConstructionGuidelinesforCorpusofEmbodiedIntelligence
2025-04-30发布2025-05-01实施
上海市人工智能行业协会 发布
T/SAIAS018—2025
目次
前言IV
引言VI
1范围1
2规范性引用文件1
3术语和定义1
4缩略语2
5具身智能数据2
5.1一般原则2
5.2数据集2
5.2.1数据片段2
5.2.2时间切片3
5.3数据资源3
5.3.1数据资源类型3
5.3.2数据信息存储格式3
6具身智能数据采集4
6.1真实数据采集4
6.1.1采集方式4
6.1.2采集本体5
6.2合成数据采集5
6.2.1采集方式5
6.2.2合成数据有效性考虑因素5
6.2.3合成数据生成方式5
6.2.4合成数据用途6
6.3采集数据提交6
6.3.1数据文件标识6
6.3.2数据提交方式6
6.4数据采集场景与任务体系7
6.4.1场景7
6.4.2任务7
6.4.3原子技能7
6.5数据采集操作规范7
6.5.1采集环境要求7
6.5.2采集设备选型7
6.5.3采集人员培训7
7具身智能语料生产8
7.1采集数据完整性检查8
7.2数据资源清洗过程8
I
T/SAIAS018—2025
7.2.1主要流程8
7.2.2数据规范管理8
7.2.3数据整理分类8
7.2.4数据脱密脱敏8
7.2.5数据去噪9
7.2.6数据去重9
7.2.7数据存储与备份9
7.3数据资源标注过程9
7.3.1基本要求9
7.3.2标注任务制定9
7.3.3数据标注检查流程9
7.3.4定义坐标系9
7.3.5标注方法9
7.4数据质量评估10
7.4.1基本要求10
7.4.2数据准确性10
7.4.3数据一致性10
7.4.4数据适用性10
7.5数据有效性评估11
7.5.1数据集选型11
7.5.2模型选型11
7.5.3测试本体选型11
7.5.4测试任务设计11
7.5.5测试指标设计11
7.5.6模型测试执行11
8数据安全11
8.1安全性评价11
8.2安全管理流程11
8.3安全技术12
8.4人员管理12
附录A(资料性)具身智能语料库数据资源类型13
A.1视频数据13
A.2雷达数据14
A.3音频数据15
A.4本体数据15
A.5轨迹导航数据16
附录B(资料性)具身智能遥操作模式数据采集本体参考性能参数17
文档评论(0)