- 1、本文档共12页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
人机协同的半自动标注框架
华为2012实验室
应江勇
数据标注为何重要
机器学习典型流程及耗时结构
问题抽象 训练数据的重要性
训练数据准备
5% 训练数据决定模型性能上限
70%
1 训练数据准备耗时占比达到70%
模型发布
2
5% 5 数据标注的必要性
训练调优 4
从业界看,算力和算法快速发展,但算例却
10% 基本停止不前
3 数据获取成本高,如何拉低数据标注成本是
算法设计 当前研究热点和难点
10%
2
数据标注当前面临的主要问题
主流 1 2 人工标注少部分 3 模型预标注全量
标注方式 人工标注 +模型迭代标注大部分 +难例人工标注
纯人工标注 半自动标注
众包 多次训练
错检
主要不足
全量 依赖人工标注结
果, 置信度低不一定
是难例
3
半自动标注框架有效解决数据标注业界难题
业界代表性半自动标注流程 华为半自动标注流程
训练+推理
1
待标 人工 主动 标注
注 标注 学习 数据 推理
数据 2 计算
难例 1 正例 3
3 (大
人工 (大量) 待标 模型 量) 人工 标注
复检
您可能关注的文档
- 2.编码感知 画质重生 打造超清视界-力奥冯浩.pdf
- 无处不在的智能边缘云,5G+AI时代的基础设施-华为李义.pdf
- 精英数智携手华为云快速构建云边端协同的煤矿大脑-精英数智王宇.pdf
- EMQ携手华为云打造智能边缘应用生态-EMQ金发华.pdf
- 终端云在华为云上的应用实践-华为终端葛正恺.pdf
- 云基础设施的智慧进化 有瑶光 慧用云-华为王黎.pdf
- Zero,华为下一代软硬结合虚拟化3.0架构-华为刘劲松.pdf
- 02-大数据金融解决方案探索-民生银行曹玲.pdf
- 03-华为携手云天励飞构建城市AI大脑-云天励飞邹博.pdf
- 1、华为OceanStor全闪存,重定义高端闪存新标杆-华为程林.pdf
- 第十一章 电流和电路专题特训二 实物图与电路图的互画 教学设计 2024-2025学年鲁科版物理九年级上册.docx
- 人教版七年级上册信息技术6.3加工音频素材 教学设计.docx
- 5.1自然地理环境的整体性 说课教案 (1).docx
- 4.1 夯实法治基础 教学设计-2023-2024学年统编版九年级道德与法治上册.docx
- 3.1 光的色彩 颜色 电子教案 2023-2024学年苏科版为了八年级上学期.docx
- 小学体育与健康 四年级下册健康教育 教案.docx
- 2024-2025学年初中数学九年级下册北京课改版(2024)教学设计合集.docx
- 2024-2025学年初中科学七年级下册浙教版(2024)教学设计合集.docx
- 2024-2025学年小学信息技术(信息科技)六年级下册浙摄影版(2013)教学设计合集.docx
- 2024-2025学年小学美术二年级下册人美版(常锐伦、欧京海)教学设计合集.docx
文档评论(0)