软件行业-数据集标注质量检查表-2026.docxVIP

  • 1
  • 0
  • 约小于1千字
  • 约 1页
  • 2026-06-26 发布于广西
  • 举报

软件行业-数据集标注质量检查表-2026.docx

软件行业模板2026·AI/ML

版本:V3.0-2026

生成:2026-06-25

数据集标注质量检查表

DataAnnotationQualityCheck·训练数据管理

数据集名称:________________

任务类型:□分类□NER□OCR□分割

检查日期:2026-06-25

标注总量:____条

抽样数:____

一致性目标:≥95%

质量检查

维度

检查项

标准

抽样结果

是否达标

改进措施

一致性

标注员间一致性(Kappa)

≥0.8

____

□是□否

覆盖率

标签分布均衡性

各类≥10%

____

□是□否

准确率

抽样审核准确率

≥95%

____%

□是□否

完整性

缺失标注比例

1%

____%

□是□否

偏差

标签偏差检查

无明显偏差

□是□否

边界

边界Case覆盖率

包含≥50+

____

□是□否

检查人:______________

标注质量负责人:______________

ML工程师确认:______________

注:一致性0.8须重新培训标注员或优化标注规范。标注质量报告随数据集版本一同归档。

文档评论(0)

1亿VIP精品文档

相关文档