- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
LOGO 录音标注新手入门手册 培训流程 项目概况说明 1 软件操作讲解 2 标注规范讲解 3 质检验收标准讲解 4 3 项目概况说明 ? 项目名称: 录音数据标注项目 ? 项目结果应用领域: 语音识别技术 ? 应用目的: 提高语音识别引擎的识别率,即提高语音识别结果的准确率。 ? 技术应用: 1 、呼叫中心自动质检(可以对通话记录进行自动质检,以减少人工质检) 2 、语音自动转文字;如微信对用户的语音进行了标注,则实现了语音转文字 的功能;类似的应用有:百度语音助手、苹果 siri 等; 3 、其他的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简 单的听写数据录入等 标注软件操作讲解 一、打开软件 二、导入录音文件 1 、上传录音 双击 praat.exe 只保留 Praat objects 窗口,其他窗口关闭即可 点击: Open 点击: read from file 选择录音文件 标注软件操作讲解 2 、生成 textgrid 文件进行标注 点击右手边的 Annotate 选项 点击 To TextGrid 选项 在弹出的 Sound ; To TextGrid 界面输入标注层次名 点击确定后 按住 Ctrl 键,同时选中 wav 文件和 textgrid 文件,点 击右侧的 Edit 出现标注界面,进行标注 三、常用操作指令 ? 播放 / 暂停: Tab 键 ? 放大 / 缩小:界面左下角: all 全屏显示; in 逐步放大; out 逐步缩小; sel 选中部 分全屏显示 ? 选中音频:在语音波形上拖动鼠标 ? 拖动音频:拖动标注界面最下的滑动条 ? 生成切割线:在语音波形上用鼠标点击需切割处,即出现一条红色虚线,同时该 红色虚线与每个标注层的相交处有一个空心圆圈。点击空心圆圈,即可生成切割 线。(快捷键: Enter ) ? 移动切割线:鼠标点住要移动的切割线,左右拖动。 标注软件操作讲解 标注软件操作讲解 ? 删除切割线: 1 、快捷键 Alt+Backspace 2 、点击界面左上顶部“ Boundary ”选项 - 选择 Remove, 即可删除。 ? 保存: Ctrl+S ? 查看秒数:在标注层下面,滑动条上面,有三个显示依次为:每个切割片切割秒数、 屏显秒数、整条音频秒数 ? 做完之后删除记录:选中文件之后,点击左下角的 Remove 标注规范讲解 一、语音文件分类 按语音质量,把语音文件分为两大类:一类为训练语音;另一类为非训练语 音。(本项目只标注训练语音,非训练语音不标注) ? 非训练语音识别条件 ① 文件大小方面: 文件大小为 200KB 以下的语音;(时长过短,未形成对话的语音) ② 噪音方面: 整段语音伴有严重的持续背景噪音的语音;(背景音如严重电流声、 风声和干扰声等) ③ 文本方面: 不能听懂的方言类语音,如某些南方方言等;经常性听不清,不能准 确写出文本的语音;无贡献文本的语音(如:文本只有“喂,你好”这几个字的语 音);整段语音中 50% 以上文本为脏话的语音。 ④ 其他方面: 回声大的语音(听觉上出现双字的语音);过载严重的语音(音量过 大导致截幅严重的语音,这里指全段语音的每字都严重截幅的语音;稍微截幅的要算 作训练语音中标注)。 标注规范讲解 二、标注层级 标注层级 情绪层 (emotion) 1 、标注语音对应的文本和噪音标识 ; 2 、中文文字要与语音一致 1 、标注主说话人的角色、性别和身份。 2 、客服用 A 表示,客户用 B 表示; 3 、用“ M 、 F ” + 编号 1 或 2 ,分别表示男 (male) 、女 (female) 性别;性别相同 时,用数字按编号 1 、 2 来区别身份。 如: AF1 、 BF2 ……(两女声), AM1 、 BM2 ……(两男声), AF1 、 BM1 ……(一 男一女) 中文层 ( chinese ) 说话人层 (speaker) 标注该段语音的语速、情绪 图片案例 标注规范讲解 三、标注规范细则 两个主说话人的语音 片段(一般为两个主 说话人:一个客服一 个客户) 背景无噪音或有轻 微噪音时 背景有严重噪音时 (听感上达到说话 声的 30% 以上,为 严重噪音) 1 、切割此片段 标记上所说文本(片段不要 过长,一般控制在 2~6 秒,以语义完整的一 句话为一个片段;特殊情况下,最长不超过 10 秒) 2 、数字和符号需转换成汉字,例 70% 写为百 分之七十; 3 、切割的语音片段首尾要留有一定余量 (首尾为静音段时可以多留余量, 1 秒都可 以,首尾为噪音段时,要稍微紧贴语音) 4 、 音译词用中文写出,如拜拜、英格兰、 保时捷等 将语音文本加上 [] 标记,其他同上。 图片案例 标注规范讲解
您可能关注的文档
最近下载
- TSGZ8001—2019特种设备无损检测人员考核规则(去水印版).pdf VIP
- 企业工会助推企业高质量发展.docx VIP
- 圆明园的毁灭观后感.docx VIP
- 《新能源汽车驱动电机及控制技术》 课件 3.1 电机控制器检测与故障诊断.pptx
- GB∕T 5777-2019 无缝和焊接(埋弧焊除外)钢管纵向和∕或横向缺欠的全圆周自动超声检测(含2021年第一号修改单).pdf
- 汽修安全培训课件.ppt VIP
- 网络改造设计方案.doc VIP
- 《圆明园的毁灭》课文读后感.docx VIP
- 旅游大数据(北京第二外国语)中国大学MOOC慕课 章节测验期末考试答案.docx VIP
- 统编版四年级语文上册课件《西门豹治邺》.pptx VIP
文档评论(0)