- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
T/EJCCCSEXXX-XXXX
大数据数据标注基地技术要求
1范围
本文件规定了大数据数据标注基地的基础设施、人员管理、数据处理流程、数据质量控制、数据安
全管理的要求。
本文件适用于从事大数据数据标注业务的基地建设、运营和管理。
2规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,
仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本
文件。
本文件没有需要引用的文件。
3术语和定义
下列术语和定义适用于本文件。
3.1
数据标注Dataannotation
对原始数据进行加工处理,赋予数据特定标签或标记,使其具有可理解的语义信息,以便后续数据
分析、模型训练等应用。
4基础设施
4.1场地设施
4.1.1办公场地
4.1.1.1数据标注基地需配备充足且适宜的办公场地。
2
4.1.1.2人均办公面积宜不低于6m。
2
示例:若一个基地计划容纳200名标注员,那么办公场地面积至少应为1200m。
4.1.1.3办公场地应具备良好的采光与通风条件,室内自然光照度应不低于300勒克斯,通风换气次
数每小时应不少于3次。
4.1.2休息区域
4.1.2.1基地应设置专门的休息区域,面积不低于办公场地面积的15%。
4.1.2.2休息区域应配备舒适的休息设施,应包括但不限于沙发、茶几、饮水机。
4.1.3会议与培训场地
4.1.3.1基地应设立独立的会议与培训场地。
1
T/EJCCCSEXXX-XXXX
4.1.3.2会议场地面积应根据基地规模合理规划,应可容纳50人~100人。
4.1.3.3培训场地应配备多媒体教学设备,应包括但不限于高清投影仪、音响系统、电子白板。
4.1.4网络设施
4.1.4.1基地应部署万兆光纤网络,网络带宽峰值应不低于5000Mbps。
4.1.4.2网络应具备良好的稳定性,网络丢包率应控制在0.1%以内,网络延迟应不超过20毫秒。
4.2设备设施
4.2.1计算机设备
标注员使用的计算机应具备较高的性能,其配置应能满足处理复杂的数据标注任务。
4.2.2数据存储设备
4.2.2.1基地应采用企业级分布式存储系统,初始存储容量应不低于50TB,应具备良好的扩展性,
应根据业务增长随时增加存储节点。
4.2.2.2存储系统应具备高可靠性,应采用冗余存储技术,如RAID6或更高等级的冗余方案。
4.2.2.3存储系统的读写性能应满足业务需求,顺序读写速度应分别不低于500MB/s和300MB/s。
4.2.3数据备份设备
4.2.3.1应采用异地多副本备份策略,采用磁带库和云备份相结合的方式进行数据备份。
4.2.3.2磁带库应具备大容量存储能力,单盒磁带容量应不低于10TB,备份频率应为每天一次全量
备份,每周进行一次异地数据传输。
4.2.3.3云备份服务应选择具有高可靠性和安全性的云存储提供商,应实时同步关键数据,数据应能
实现在任何情况下都可快速恢复。
4.2.4数据标注辅助设备
根据不同的数据标注类型,基地应配备相应的辅助设备。
5人员管理
5.1人员资质
5.1.1标注员
5.1.1.1学历与基础技能
5.1.1.1.1应具有符合操作素质需求的学历。
5.1.1.1.2应熟练掌握计算机各项基础与高阶操作。
5.1.1.1.3应具有符合操作素质需求的有效打字速度。
5.1.1.2专业培训与知识掌握
5.1.1.2.1应按时完成严格规定的专业数据标注培训课程。
5.1.1.2.2培训结束后,须通过严格的理论和实操考核,成绩应达到规定合格分数,且实际操作符合
标注规范要求,方可正式上岗。
5.1.1.2.3应熟悉各类常见数据标注类型的基本流程和规范,且具备相应语言理解能力
您可能关注的文档
- 《储罐呼吸阀风险评估及在线检验技术规范》征求意见稿.docx
- 《储罐呼吸阀风险评估及在线检验技术规范》征求意见稿.pdf
- 《大数据 数据标注基地技术要求》征求意见稿.docx
- 《工业应用移动机器人 复合机器人仿真技术通用要求》(征求意见稿).docx
- 《工业应用移动机器人 复合机器人仿真技术通用要求》(征求意见稿).pdf
- 《户外LCD显示屏环境可靠性试验方法》(征求意见稿)编制说明 .docx
- 《户外LCD显示屏环境可靠性试验方法》(征求意见稿)编制说明 .pdf
- 《会议服务接待规范》编制说明.docx
- 《会议服务接待规范》编制说明.pdf
- 《脑波反馈训练规范》征求意见稿.docx
- 2024年度党员干部民主生活会班子对照检查材料.docx
- 公司党委领导班子2024年度民主生活会对照检查材料4个带头方面.docx
- 市府办(政府办)领导班子2024年民主生活会会后综合情况报告.docx
- 在2025年市司法局信息宣传工作推进会上的讲话.docx
- 在2025年全省文化旅游高质量发展推进会上的讲话.docx
- 在2025年全区工业、住建大规模设备更新推进会上的讲话.docx
- 党支部2024年组织生活会民主评议党员情况总结报告_1.docx
- 2024年度组织生活会个人对照检查剖析材料.docx
- 镇党委书记2024年度民主生活会对照检查材料1.docx
- 党支部2024年组织生活会民主评议党员情况总结报告.docx
文档评论(0)