汉语耳语音重建的分析.pdfVIP

下载本文档

2
0
约4.86万字
约 47页
2019-01-10 发布于安徽
举报
版权申诉

汉语耳语音重建的分析.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第一章绪论第一章绪论 1．1背景及意义语音是人类交流的一种最重要、最快捷的形式。近几十年来随着数字信号技术的进步和信息论理论不断地完善，语音方面的商业产品不断地涌现，理论也在不断地趋于成熟。语音识别技术使得手机等设备上出现了语音输入法；说话人识别可以通过说的语音识别出说话人；语音编码使语音在网络上传输和存储的数据量大大压缩；在背景噪声干扰下，语音增强可以使对方较清楚的辨听出语音。虽然如此，由于人类语音产生过程的复杂性和语音信息的丰富性及多样性，迄今为止还没有找到一种能够精确描述语音产生过程和所有特征的理想模型。人类自身的发声原理、听觉感知原理仍然是一个很深刻的课题。耳语音是一种特殊的语音形式，它有别于正常语音的发音方式。耳语音的主要特点是发音时语音能量低、声道传输偏移、而且声带处于完全不振动状态…。它和正常语音的最主要差别在于无基音频率和因声道传输函数改变使得共振峰发生偏移。这些因素导致耳语音信号不仅信噪比低而且可懂度和清晰度都比较差。为了在通信交流中不影响他人或者保证交流保密性，耳语音这种交流的形式就会被使用。但是正因为这种方式的特点既影响了交流的质量，又易使交流双方产生说话和听觉疲劳。有关耳语音的研究近几年来逐渐得到国内外相关研究机构的重视。首先，目前大部分的语音研究主要集中在正常语音的语音识别、说话人识别、语音的增强等等方面。由于耳语音信噪比低的特点，导致清晰度和可懂度都较差，所以关于耳语音增强方面的研究【2’3】就随之引来了关注。其次，对于在安静环境中的手机通话或者对于喉头切除者患者，他们在交流过程使用耳语音，为了使对方能够更加清楚的理解耳语音信息，关于耳语音转换为正常语音的研究随之而来，以帮助说话者与接听者之间的交流。最后，由于目前基本上所有的系统和设备都是基于正常语音，例如：语音识别、语音增强和情感分析，若将其系统直接应用于耳语音，必然因耳语音和正常音的差别而使特征产生很大的差异，进而导致模型失配使其性能降低。那么维持原有的设备和系统，就要将耳语音转化为正常语音。汉语耳语音重建的研究 1．2耳语音重建研究的概况耳语音作为一种语音的形式，其研究方面远远不及学者们对正常语音的研究。但由于耳语音具有其自身的应用价值，所以自二十世纪中期以来，学者们对其研究越来越多。对耳语音特性的研究有耳语音发声部位和声音感知的研究【lJl4】、耳语音音素感知辨认【5】等等。其次，在了解了耳语音的一些特性之后，学者们又对其共振峰【6～、耳语音识别【8】和说话人性别识别【91进行研究。近几年来对耳语音的研 oj方面进行了研究，究引起了各国学者的重视。Morris在英语耳语音转换11 ExcitedLinear Sharifzadeh使用CELP(CodePrediction)模型对耳语音进行了重建…J，对耳语音的元音共振峰㈣及听觉感知flq方面进行研究，牛津大学Coleman教授的课题组对耳语音喉部运动与语调的关系进行了研列15】。在国内，南京大学声学研究所以徐柏龄为首的研究组对汉语耳语音的声学应用和在手机通话中语音抵消方面进行研究【16】；苏州大学以国家自然基金项目为依托对耳语音特性【17’18】和转换【19也2] 进行了研究；东南大学以赵力教授为首的语音研究组对耳语音增强方面【23】也进行了深入的研究。有关耳语音重建目前存在几个困难：第一、耳语音中有声段和无声段的分割不明显：第二、耳语音的发声声道和正常发音模式不一样，从而导致声道传输函数的改变和共振峰的偏移；第三、由于耳语音的声韵母都是噪声激励产生的，故耳语音中的声母和韵母的特征差异不明显，进而对耳语音的声韵分割增加了难度：第四、耳语音产生时声带不发生振动，进而导致汉语最重要的声调表征一一基频丢失。对于耳语音重建的已有研究可知，Morris博士提出了谱修正法f24】对英语耳语音中共振峰参数进行了修正，在合成语音的时候将所有音默认为浊音，并根据耳语音的能量来添加基频，利用了混合激励线性预测(MELP)模型实现了英语耳语音向正常语音的转换。而Morris博士将MELP模型中的四个低频带作为浊音段，高频带作为清音段，所以重建后