- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于语料库的时长规整化研究
援治纲
中固社会科学院语言研究所语音研究室
摘要
奉文在语音语料库切分和标记的基础上,对语音单元的耐长规整化方法进行了初步研究.
探讨了语音单元时长的概念、影响时长的主要因素和进行时长规整化的意义,并在分析目前
常用时长规整化方法优势和不足的基础上,提出了一种融合传统方法的新的时长规整算法.
该算法主要包括3个过程:(1)计算不同发音人在不同状态空闻下语料的相对语速;(2)用
语音单元的物理时长除以其相对语速,可以得到语抖排除语速影响后的规整时长;(3)对语
音单元的规整时长进行Z-SCORE规一,可以得到语料的规一化时长.该方法经过实践验证,
可更好的提高语音单元时长的规整度,为以后进行更深入的语音研究打下良好基础.
引言
“时长”是语音研究中一个非常重要的要素,它作为一个基本的语音参数被广泛应用于
语音研究的各个领域,在现在的语音工程技术,如识别、合成时长建模等研究中,其作用尤
为明显。
通常情况下,言语产生的环境是不同的,其时长特征受发音人语速、语音单元语音特性
等诸多因素影响。在这种状况下,语音单元的对长是处在不同状态空闻的,它们相互之间无
法直接进行比较,其研究和利用的价值也不大。要想解决这个问题,只能将语音资料进行规
整处理.使它们处于同一状态空间内.这个过程就是时长的规整化。
在现代语音研究中,时长的规整化可以说是进行其它更深入语音研究的前提和基础.其
现实意义是不言而喻的。
1时长规整化的相关概念
1.1时长的概念
要进行时长规整化,首先要明确什么是“时长”.在语音研究中,经常使用的时长概念有
两个.它们分别是“绝对时长”和“相对时长”。
绝对时长:又叫物理时长.是指所研究的语音单元持续的时间长度。
相对时长:即所谓的规整化时长,是指所研究的语音单元的绝对时长经过规整化变换后
在新的规整化坐标系统中的时长。在实际研究中,一般规整化时长(相对时长)的使用价值
更太。
1.2影响时长的因素
时长规整化过程要规整的内容是什么昵?首先要看一下影响时长的因素.它们主要可以
分为两类:一种是语音单元(如音子、半音节、音节等)的声学、语音学特征对其时长造成
的影响,相关因素有:语音单元所处韵律边界位置;较太语音单元(如音节)所含音子数目;
轻读、重读的影响:声母受后接韵母协同发音的影响因素;声调的影响……
另一种是非上述因素对时长造成的影响,如:语速的影响;语用的影响……
语音单元的绝对时长是以上各因素(或几种因素)共同作用的结果,但第一类因素往往
认为是语音单元不可缺少的内在特征,一般是不能消除的.而第二类因素作为语音单元的外
在影响因素,可以根据研究的需要进行相关的时长规整化处理。
1.3时长规整化的内容
理论上,上述凡是对时长研究存在干扰的外在因素,都应被规整掉。但在事实上,时长
规整化过程要想排除所有干扰因素,在目前阶段不管从理论还是技术上都是很难作到的,所
以现在实际的时长规整化只能首先尽可能排除较大的干扰因素。经过实验的不定量统计,发
音人的语速是对语音单元时长造成影响最大的干扰因素之一。
这种语速对时长的影响作用,不止在自然语料中表现明显,即使在发音较为标准的朗读
语料中表现也很强烈。
“ASccD朗读语篇语料库”是中国社科院语言所语音室录制的标准普通话朗读语料库,库
容量约10万音节,由lO位发音人(5男+5女)朗读相同的的18篇文章。经过统计.各人以
各自适中语速朗读的语料其速度差异是较明显的.结果如表1。
发音人编号 F0l F02 F03 F04 F05 M0l M02 H03 M04 肼05
相对语速 0.99 l_020.98 l-06i.iO 1.iO0.85 口781.06 1.02
表1.ASCCD发音人语速统计
从宏观上统计.发音人相同语音单元时长之比,和其语速之比基本成反比例,由此可见,
时长在语速影响下其差异也是明显的.所以语速是进行时长规整化时要首先考虑的因素之一。
2传统的时长规整化方法
2.1Z-SCORE算法
Z
您可能关注的文档
- 棉田复种耕作制度的生态经济优势的研究.pdf
- 先进太阳能热动力系统热管吸热器的研究.pdf
- 化工过程远程故障诊断系统多Agent建模的研究.pdf
- 杭钢转炉炼钢厂Q215钢洁净度的研究.pdf
- 抗草甘膦转基因大豆PCR定量检测的研究.pdf
- 膜下条播冬麦适宜揭膜期气象指标的研究.pdf
- 图象技术在泥沙起动的研究中的应用.pdf
- 基于OLE技术煤矿地质测量网络报表系统研发.pdf
- 人工神经网络在板料成形性的研究中的应用.pdf
- 滑菇杂交育种的研究初报.pdf
- 2025年郑州生产文员面试题库及答案.doc
- 北京市新学道临川学校2020-2021学年高一上学期期中考试数学试题Word版含答案.doc
- 家用电子产品维修工职业资格证书维持考核试卷及答案.doc
- 北京市平谷区2018-2019学年高一上学期期末质量监控物理试题原卷版.doc
- 北京市昌平区2018-2019学年高一上学期期末质量抽测物理试题原卷版.doc
- 北京市丰台区2021-2022学年九年级上学期期末练习语文题.docx
- 北京市北师大附属实验中学2019-2020学年九年级下学期阶段测验数学试题解析版老头.doc
- 2025年渝利铁路专业面试题库及答案.doc
- 北京顺义区2021-2022学年高二下学期期末考试化学试题原卷版.docx
- 北京市各区20212022学年度第一学期期末考试七年级语文试卷古诗专题解析.docx
原创力文档


文档评论(0)