基于语料库的时长规整化的研究.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于语料库的时长规整化研究 援治纲 中固社会科学院语言研究所语音研究室 摘要 奉文在语音语料库切分和标记的基础上,对语音单元的耐长规整化方法进行了初步研究. 探讨了语音单元时长的概念、影响时长的主要因素和进行时长规整化的意义,并在分析目前 常用时长规整化方法优势和不足的基础上,提出了一种融合传统方法的新的时长规整算法. 该算法主要包括3个过程:(1)计算不同发音人在不同状态空闻下语料的相对语速;(2)用 语音单元的物理时长除以其相对语速,可以得到语抖排除语速影响后的规整时长;(3)对语 音单元的规整时长进行Z-SCORE规一,可以得到语料的规一化时长.该方法经过实践验证, 可更好的提高语音单元时长的规整度,为以后进行更深入的语音研究打下良好基础. 引言 “时长”是语音研究中一个非常重要的要素,它作为一个基本的语音参数被广泛应用于 语音研究的各个领域,在现在的语音工程技术,如识别、合成时长建模等研究中,其作用尤 为明显。 通常情况下,言语产生的环境是不同的,其时长特征受发音人语速、语音单元语音特性 等诸多因素影响。在这种状况下,语音单元的对长是处在不同状态空闻的,它们相互之间无 法直接进行比较,其研究和利用的价值也不大。要想解决这个问题,只能将语音资料进行规 整处理.使它们处于同一状态空间内.这个过程就是时长的规整化。 在现代语音研究中,时长的规整化可以说是进行其它更深入语音研究的前提和基础.其 现实意义是不言而喻的。 1时长规整化的相关概念 1.1时长的概念 要进行时长规整化,首先要明确什么是“时长”.在语音研究中,经常使用的时长概念有 两个.它们分别是“绝对时长”和“相对时长”。 绝对时长:又叫物理时长.是指所研究的语音单元持续的时间长度。 相对时长:即所谓的规整化时长,是指所研究的语音单元的绝对时长经过规整化变换后 在新的规整化坐标系统中的时长。在实际研究中,一般规整化时长(相对时长)的使用价值 更太。 1.2影响时长的因素 时长规整化过程要规整的内容是什么昵?首先要看一下影响时长的因素.它们主要可以 分为两类:一种是语音单元(如音子、半音节、音节等)的声学、语音学特征对其时长造成 的影响,相关因素有:语音单元所处韵律边界位置;较太语音单元(如音节)所含音子数目; 轻读、重读的影响:声母受后接韵母协同发音的影响因素;声调的影响…… 另一种是非上述因素对时长造成的影响,如:语速的影响;语用的影响…… 语音单元的绝对时长是以上各因素(或几种因素)共同作用的结果,但第一类因素往往 认为是语音单元不可缺少的内在特征,一般是不能消除的.而第二类因素作为语音单元的外 在影响因素,可以根据研究的需要进行相关的时长规整化处理。 1.3时长规整化的内容 理论上,上述凡是对时长研究存在干扰的外在因素,都应被规整掉。但在事实上,时长 规整化过程要想排除所有干扰因素,在目前阶段不管从理论还是技术上都是很难作到的,所 以现在实际的时长规整化只能首先尽可能排除较大的干扰因素。经过实验的不定量统计,发 音人的语速是对语音单元时长造成影响最大的干扰因素之一。 这种语速对时长的影响作用,不止在自然语料中表现明显,即使在发音较为标准的朗读 语料中表现也很强烈。 “ASccD朗读语篇语料库”是中国社科院语言所语音室录制的标准普通话朗读语料库,库 容量约10万音节,由lO位发音人(5男+5女)朗读相同的的18篇文章。经过统计.各人以 各自适中语速朗读的语料其速度差异是较明显的.结果如表1。 发音人编号 F0l F02 F03 F04 F05 M0l M02 H03 M04 肼05 相对语速 0.99 l_020.98 l-06i.iO 1.iO0.85 口781.06 1.02 表1.ASCCD发音人语速统计 从宏观上统计.发音人相同语音单元时长之比,和其语速之比基本成反比例,由此可见, 时长在语速影响下其差异也是明显的.所以语速是进行时长规整化时要首先考虑的因素之一。 2传统的时长规整化方法 2.1Z-SCORE算法 Z

文档评论(0)

youyang99 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档