汉语语音信号的端点检测和切分.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
150 信号处理 汉语语音信号的端点检测与切分★ 郭巧 张立伟 陆际联 (北京理工大学机器人研究中心,北京IOC081) 【摘要】本文采用短时相对能频积的方法对汉语语音信号的端点进行检测l采用短时相对能频比的方法对 语音信号的清浊音进行切分.这两种方法的使用与现有方法相比可以有效地提高汉语语音信号切分的成功率. 实验结果表明这两种方法的使用可以使汉语语音信号切分的正确率达到95%以上,基本上能蟹满足计算机辅助 汉语教学系统在线切分汉语语音信号的需要,比已有的语音信号切分方法的切分效果有显著提高,为下一步提 高语音信号的识别率奠定了好的基础. 关键词:语音信号处理语音信号切分计算机辅助教学 一、引言 随着我国改革开放和对外合作的不断深化.商务往来、文化交流、来华旅游等活动日益频繁,越来越多的 外国人需要学习汉语.外国人学习汉语存在的一个主要问题是发音不易准确.传统的汉语教学方法有着种种不 足之处.诸如,课堂教学通常受时阃、地点以及教师教学水平的限制;广插电视教学和录音录象教学等教学手 段不够灵活.无法及时地分析学习者存在的目题。因此也就不能及时地:有针对性地反馈指导意见. 随着计算机技术的飞速发展和数字信号处理技术(特别是语音信号处理技术)的日臻完善。使得采用计算 机进行对外汉语教学成为可能.为了构造能够在线自动评价语音学习效果的计算机辅助汉语多媒体语音教学系 统,需要有好的语音识别系统.而好的语音识别系统又必须建立在正确地进行语音信号韵端点检测与切分的基 础上. 我们知道,汉语语音识别中并不是所有的语音信号都是有用信息.通过对语音信号的波形分析可以看到. 语音信号中开始很长一段属于无声段,母段语音的最后一段也是无声段.如果在语音识别时把这两部分包括在 内,会增加很大的工作量同时还增加了语音识别的难度.作为语音识别的基础,语音信号端点的检测不但是必 须的,而且是语音识别的关键之一. 在语音识别中。一段语音信号的端点检测完毕后,需要对这一段语音信号作进一步的切分处理,也就是要 对它进行音节及其声韵母的切分.切分后的语音信号才能被识别。可以说没有正确的语音切分就没有正确的语 音识别. 二、语音信号的分类及其各类的特点 语音信号一般可分为无声段、清音段和浊音段.无声段的平均能量娘低,浊音段的平均能量最高,清音段 的平均能量居于两者之间。在噪声较低的环境下,清音段的平均能量一般比无声段的能量高出几倍到几卜倍, ’国家自然科学基金资助项目 信号处理 而浊音段的平均能量则能高出几十倍至上百倍,应用平均能量基车上能粗略地将它们分扦。 对于语音信号的这三部分来说,另一个同等重要的特征参数是它们的过零率。清音段的过零率大多数情况 下最高;无声段的过零率变化范围较大,一般情况下比浊音段低一点,但有时会比浊音段稍高一些或者差不多. 三、特征参数的定义和提取 语音信号通过麦克风输入到声卡,声卡通过一定的采样频率把连续的语音信号变成数字信号,这些数字信 号的频率和精度可以根据需要设定.这里。我们采用采样频率16KHz、精度16bits。通过声卡采样后得到的数 字信号用s(n)表示. 由于录音和发声的间隔,正常情况下语音信号的前100ms是无声段,所以我们可以提取这段语音信号的 平均能量、平均过零率、它们的乘积(称为能频积)和它们之比(称为能频比)作为进行粗略判断时的特征参数.又 由于某些声母发声短促,用振幅的平方表示能量时数值过大,因此,在切分和端点检测过程中,采用方窗,窗 的长度为5ms,用振幅的绝对值表示能量x(i),加窗后的语音信号为S。.具体的实现过程如下: f=o~(,一1), x(f)=ls。(f)I=Is(J】}·J+圳, . t I=16000+0.005=80.k=0~14 .1一-1 ·

文档评论(0)

baihualong001 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档