- 1、本文档共28页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
培训项目2搭建智能物联网应用培训单元1标注对象特征
01、培训重点02、知识要求03、技能操作目录
培训重点Contents01
培训重点01.掌握语音、文字和图像的样本形式和关键参数。02.理解对象的属性定义。03.能使用精灵标注助手完成图片的分类标注。
知识要求Contents02
语音、文字和图像样本采集一
一语音、文字和图像样本采集数据采集又称数据获取,是利用一种装置,从系统外部采集数据并输入到系统内部的一个接口。数据采集技术广泛应用在各个领域,如车辆识别、门禁、超市零售等。常用的数据采集工具主要有数据采集仪表,摄像头,麦克风等。1.语音样本采集一般的语音来源主要是三种,业内开放的通用训练集数据、特定用户录制的数据,采用TTS技术合成的数据。部分公司会将用户的指令数据进行收集,从而丰富通用训练集,提取高频数据集,BadCase数据集,专项数据集(方言、中英文混合)特殊场景数据集(导航、电话、音乐等其他应用冲突的场景)等等。在录制和采集语音数据时,业内一般有几个关键指标,这些指标也都和语音识别的原理及架构有关,分别是采样率、采样位数、声道数、存储空间、存储格式。
一语音、文字和图像样本采集2.图像样本采集通过摄影和摄像设备获取图像,并将图像以数字化的形式进行保存的过程称为图像数据采集,此时被采集的是几何量(或包括物理量,如灰度)数据。一般而言,在机器学习领域,数据的规模越大、质量越高,模型就能够拥有更好的识别精确度,数据量很大程度上决定了模型精确度的上限。增加数据量的一个直接方式是自行采集,通常可以通过摄像头或图像采集卡将图像保存至计算机进行处理,为后续模型训练做准备。为了提高模型的识别精确度,要保证图像数据的多样性,图像需要从不同角度、不同方向以及不同光照度下进行采集,并保证采集到的不同样本比例平衡。除了摄像设备外,目前还有很多相应的图像传感器以实现外界景物的采集,如热成像相机,高光谱成像仪雷达设备、激光设备、X射线仪、红外线仪器、磁共振仪器、超声仪器等多种接口设备与仪器。
一语音、文字和图像样本采集3.文字样本采集文字采集的方法主要有键盘录入、语音录入转文字、手写板录入、图片识别转文字、复制粘贴等方法。影响图像样本的关键指标是图像传输格式、图像格式、图像分辨率、采样频率、传输速率。
对象的属性及分类二
二对象的属性及分类对象是人们要进行研究的任何事物,从最简单的整数到复杂的飞机等均可看作对象,它不仅能表示具体的事物,还能表示抽象的规则、计划或事件。对象的属性是对象的性质与对象之间关系的统称。如事物的形状、颜色、气味、美丑、善恶、优劣、用途等都是事物的性质。大于、小于、压迫、反抗、朋友、热爱、同盟、矛盾、等都是事物的关系。而任何属性都是属于某种对象的。对象的属性有的是特有属性,有的是共有属性。对象的特有属性是指为一类对象独有而为别类对象所不具有的属性。人们就是通过对象的特有属性来区别和认识事物的。如两足、无毛、直立行走、能思维、会说话、能制造和使用生产工具进行劳动是“人”的特有属性,从而将“人”与其他高等动物区分开。而有五官、四肢、有内脏和血液循环等则不仅为人所具有,也为其他高等动物所具有,我们称为共有属性。共有属性没有区别性。
二对象的属性及分类每一个对象都有与之相关的原型、类、可扩展性。这就是对象的三个属性1)原型属性:对象的原型属性是是用来继承属性的。2)类属性:对象的类属性是用来表示对象的类型信息的。3)可扩展性:对象的可扩展性用来表示是否可以给对象添加新属性
用JSON格式标注数三
三用JSON格式标注数1.数据标注数据标注就是通过数据标注人员借助标注工具,对人工智能学习数据进行加工处理,转换为机器可识别信息的过程。通常数据标注的类型包括:图像标注、语音标注、文本标注、视频标注等种类。标记的基本形式有标注画框、3D画框、文本转录、图像打点、目标物体轮廓线等。
三用JSON格式标注数2.标注工具精灵标注助手是一款人工智能数据集多功能标注工具。精灵标记助手相比其他工具而言,上手非常简单方便,目前支持Windows/Mac/Linux平台。相比于LabelImg,RectLabel这些标注工具,只支持某个领域的标注,精灵标注助手支持图像、文本和视频等多种标注形式、可通过插件形式进行自定义标注、支持导出XML、JSON、MongoDB、Pascal-Voc格式的标注文件。3.JSON格式JSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式。JSON是JavaScript对象的字符串表示法,它使用文本表示一个JavaScript对象的信息,本质是一个字符串。JSON可以和JavaScript对象互相转换。JSON的语法基本上可以视为JavaScript
文档评论(0)