- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
标注内容
两个人的自然对话。每组对话45分钟左右,每组对话可能有一个或分成多个wav文件保存(文件名以ZXXXX开头,例如Z0001**.wav表示属于第1组对话)。
质量要求
文字错误率:3%以内
注:文字错误率指语音内容标注错误,只要有一个字错,该条语音就算错。
其他错误率:5%以内
注:综合错误率指:除了语音内容以外的其他标注项错误,只要有一项错,该条语音就算错。
标注工具
praat.exe,输出textgrid格式的标注结果(TextGrid文件)
标注要求
根据不同说话人加时间戳(每个片段不超过10秒,如果说话人连续说了10秒以上,可按句子截成多个10秒以内的片段)
并标出说话人的文字内容
无效语音段写为W:听不清的、抢话的、噪音大、静音的语音片段均被认为无效
语音内容必须和听到的语音完全一致,不能多字、少字、错字。
阿拉伯数字要写成汉字“一二三”,而不是“123”
标注中只能含有中文、英文以及常用标点符号(空格、逗号、句号、问号)
语气词: 音频中说话人清楚地讲出的语气词,如 “呃 啊 嗯 哦 唉”等,
转写内容的完整性要与实际发音一致,不得删减;
如发音为:我是北 北京人;“北”字有重复现象,那转写的时候要写成:我是北,北京人。
英文比较复杂,转写的原则是按字母读的情况(如缩写词,网址等)一律大写,按词读的则小写
明显的儿化音必须标注出来
句子间要用标点符号隔开。例如“就把这事跟我妈说了我妈也挺生气的就找来我舅其中有个哥是我舅家的孩子”应写为“就把这事跟我妈说了,我妈也挺生气的,就找来我舅。其中有个哥是我舅家的孩子”
上述文字内容中的特殊标记
*:表示人发音但无法标注语音(有一两个字听不懂或听不清)
如果有噪音,则需在噪音开始的位置插入噪音符号。
[f]:?表示说话人说话过程中的暂停停顿,例如发音:“uh”, um”, er”?和?“mm”。
[s]:?表示说话人的各种非文本内容的噪声信息,包括唇咂嘴,咳嗽,清嗓子声,啧啧声,重呼吸,笑声。
[n]:?非人发出的声音,主要是一些偶然出现的噪声,例如:鼠标操作声音,敲击键盘的声音等。
[t]:?稳定的噪声,主要是录音环境的一些非偶然噪声,例如周围音乐,风声,空调声等。
[p]:?非说话人的周围人发出的声音,包括,唇咂嘴,咳嗽,清嗓子声,啧啧声,重呼吸,笑声。
附:标注工具用法
对一个没标过的录音文件进行标注
双击praat.exe,弹出三个界面,只保留Praat objects即可,其他关闭点击菜单栏中“”下的“read from file...”按钮,
图1 生成TextGrid
在弹出的对话框中,将第二项Which of these are point tiers设为空(删去原来的Bell)。第一项All tiers name设为两个说话人的代号
如果是一男一女对话,则填写“男 女”
如果是两个男的对话,则填写“男1 男2”
如果是两个女的对话,则填写“女1 女2”
图2 两个女的对话
图3 两个男的对话
图4 一男一女对话
点击OK,会自动生成和语音文件名同名的标注文件,如a.TextGrid。按住Ctrl键同时选中语音文件a.wav和标注文件a.TextGrid,点击右侧的viewEdit按钮,出现标注界面。
图6 标注界面
请点击标注界面右上角的最大化按钮,这样可以显示全(否则最下方的滚动条可能显示不出来)。
图中最上面显示语音波形,下面依次显示定义的两个说话人层。单击标注界面左下角的“in”(或键盘按ctrl+i)、“out”(或键盘按ctrl+o)按钮可以在时间轴上放大或缩小语音波形显示。用标注界面最下的滑动条可以在时间轴拖动语音波形。
播放技巧:
按键盘上的”Tab”键可以播放或暂停语音(鼠标点在某个位置,会从该位置往后播放)。
鼠标框选一个区域后,可以点Tab键或最上面或最下面的时间值,都可播放该区域语音
生成语句分隔符:根据文本和发音来确定一段语音的分隔点,具体操作方法是在语音波形上用鼠标点击两段语音之间的静音段,即出现一条红色虚线,同时该红色虚线与下面的说话人层相交两个空心圆圈。用鼠标点击两个空心圆圈内部,会出来两根相连的蓝线,从而隔出一段语音(如图7所示)。
图7 如何生成分隔线
(注:分割线可以移动位置。要去除分隔线,需选中该分隔线,然后点击菜单栏中“”下的“Remove”按钮点击菜单栏中的“File”下的“ TextGrid as text file...”(建议用快捷键ctrl+s)按钮,弹出一个保存对话框,然后点“确定”,
对一个标过的录音文件(可能没标完、可能已标完)进行修改或查看
1
文档评论(0)