- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
汉语自然口语中声调识别的研究.pdf
第56卷第12期2007年12月 物 理 学 报
PHYSICASINICA @2007
1000.329012007156(12)/7064.06ACTA Chin.P}Iys.Soc.
汉语自然口语中声调识别的研究*
刘赵杰1’2’’ 邵 健2’ 张鹏远2’ 赵庆卫2’ 颜永红2’ 冯 稷1’
1)(中国科学院物理研究所,北京100080)
2)(中国科学院声学研究所.北京100080)
(2007年3月6日收到;2007年6月1日收到修改稿)
汉语是一种带声调的语言,声调信息在汉语识别中具有非常重要的意义.传统的声调识别一般只研究朗读式
语音中相对标准的声调,很少对声调调型比较复杂的自然口语进行专门的处理.针对汉语自然口语的特点,在声调
建模单元的选择时提出了真实上下文的模型.同时,为了对声调模式进行精细建模,采用了一种层次聚类的方法来
获得更多的声调模式.实验结果证明了方法的有效性.
关键词:声调识别,自然口语,真实上下文模型,聚类
PACC:4370C,8736
字组、四字组声调模式进行了研究,给出了一些定性
1.引 言 的分析结果;文献[3]采用定性分析总结出应用声调
识别的23种模式.由于语音数据变化随机性很大,
声调是汉语音节中的三要素之一,人们不仅要 这些方法往往只重视对少量语音数据特例的分析,
凭借不同的声母、韵母来辨别字和词的意义,还需要 很难反映比较全面的声调变化规律.而后者主要是
以不同的声调来区别它们.如果将音节与声调分开 通过从训练语料中统计出声调模式的变化规律,然
后对其进行定量描述.如文献[4]利用聚类分析提取
考虑,汉语的1300多个带调的音节可以减少到400
多个无调音节,这对于简化识别的模型和搜索的空 句子中音节的基频模式;文献[5]利用决策树的数据
间是很有益处的.在现代汉语普通话中通常把声调 驱动方法从大规模语料中统计出连续语音中声调可
能的模式分布.由于语音数据的复杂性,只有数据驱
分成五种:一声(阴平)、二声(阳平)、三声(上声)、四
声(去声)和轻声,不同的声调对应着不同的基频变 动和知识驱动结合起来才能够对声调模式进行描述.
化曲线.轻声只有在两个音节以上的连续语音中才 目前连续语音识别的趋势是从朗读式语音识别
会出现,而且轨迹曲线比较短,接近于四声,但形状 到自然口语语音识别.相对于朗读式语音而言,自然
很不稳定且变化较大,所以本文的研究中没有考虑 口语是人类相互交流的一种最为直接、最为自然的
轻声. 方式,在声学层面上往往包含了多变的语速、真实的
在汉语连续语音识别系统中,如果能获得准确 情绪和严重的协同发音现象等.由于自然口语的上
的声调信息将会有效地提高识别系统的性能.多年 述特点会使声调基频轨迹曲线的模式变得更加复
来。许多学者在声调识别方面进行了大量的研究分 杂,准确地分析和把握这些变化的规律对于正确识
析,在孤立词和朗读式语音中取得了很多研究成 别自然口语具有重要意义.而前人的研究很少涉及
果n叫引.在研究方法上主要分为两种,基于规则的知 这个方向n¨,因此本文主要对自然口语中的声调识
识驱动和基于统计的数据驱动.前者主要是通过手 别进行了初
文档评论(0)