基于DTW算法的语音识别系统实现.pdfVIP

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于DTW算法的语音识别系统实现.pdf

第30卷第7期 电字工皇丽 V01.30No.7 2004年7月 ELECTRONICENGINEER Jul.2004 基于DTW算法的语音识别系统实现 吴晓平,崔光照,路康 (郑州轻工业学院信息与控制工程系,河南省郑州市450002) 【摘要】 动态时间归整(D聊)算法的实现简单有效,在孤立词语音识别系统中得到了广泛的 件设计。研究结果表明,系统能满足实时性能要求,识别效果良好。 关键词:动态时间归整(DTw)算法,语音识别,线性预测,端点检测 中图分类号:TN912.34 扰。语音信号经滤波和采样后,由A/D转换器转换为 0 引言 二进制数字码。 动态时间归整(DTW)算法是把时间归整和间距 语音信号的预处理一般包括预加重、加窗和分帧 测量计算结合起来的一种非线性归整技术,与隐式马 处理。预加重的目的是提升高频部分,使信号的频谱 尔可夫模型(HMM)算法相比,它不是一种有效的利用变得平坦,以保持在信号的整个频带内具有同样的信 统计方法进行训练的算法,同时,也不容易将底层和顶 噪比,便于声道参数分析。在语音信号的数字处理中 层的各种知识用到识别算法中,在解决大词汇量、连续 常用的是矩形窗和汉明窗等,窗口的形状、长度对短时 语音、非特定发音人语音识别系统时,识别效果较差, 分析参数的影响很大,为此,应选择合适的窗函数。语 ms~30 但在孤立词语音识别系统中识别效果良好,并且,由于 音信号有10 ms的短时平稳性,一般每秒的帧 数为33帧一100帧。为了使帧与帧之间平滑过渡,前 DTW算法计算量较少。因此,DTw算法在孤立词语 音识别系统中得到了较为广泛的应用。将嗍算法 一帧与后一帧之间必须保持一定的帧移,帧长与帧移 的比值一般取为O~l/2。 移植到TMs320VC5402上实现语音识别,能满足实时 性要求。 语音信号的端点检测一般采用平均能量、平均幅 度值、平均过零率等或上述几种方法的综合来判断,也 1识别系统基本原理 有一些学者提出采用频带方差、倒谱特征等方法来判 图l是实时语音识别系统的结构框图。 断。采用前者算法的计算量较小,在噪声不大的环境 下可以有效地判别语音信号的起始点与终止点。在端 点检测时若选择的窗长较大,可以加快语音处理的速 度,会跳过一些短时噪声,但是端点检测的误差会增 加。语音信号的端点检测直接影响语音信号倒谱特征 提取的误差,为此,应选择合适的端点检测算法。 由于语音信号之间存在相关性,可以用过去的样 点值来预测现在的或未来的样点值,即一个语音的采

您可能关注的文档

文档评论(0)

docindoc + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档