DTW算法的研究和改进.pdfVIP

下载本文档

9
0
约7.47千字
约 2页
2017-09-11 发布于江苏
举报
版权申诉

DTW算法的研究和改进.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

MicrocomputerApplicationsVo1．26，No．9，2010 技术交流微型电脑应用 2010年第26卷第9期文章编号：1007—757X(2010)9—0056．O1 DTW 算法的研究和改进朱曼昊张忠能摘要：对语音识别中的 DTW 算法进行了研究，提出了一种改进算法，并用实验数据进行了验证。此算法在识别度下降可接受的范围内，有效地减少了识别的时间。关键词：动态规划(DP)；动态时间归正(DTw )；语音识别中图分类号：TP311 文献标志码：A 0 引言语音的识别系统根据对说话人说话方式的要求，可以分参考模版可表示为R={R(1)，R(2)… ．，R(m)… ．，R 为孤立字 (词)语音的识别系统、连接字语音的识别系统和 ( )}，m 为模板语音帧的顺序标号，m=1为起点语音帧，连续语音识别系统；根据对说话人的依赖程度，可以分为特 m=M 为终点语音帧，因此为该模式包含的语音帧总数，定人和非特定人语音识别系统；根据词汇量大小，可以分为 R(m)为第m 帧语音的语音特征矢量。所要识别的一个输小浏汇量、中等词汇量、大词汇量以及无限词汇营语音识别入词条语音称为测试模版，测试模式可表示为T= {(1)，T 系统。流程如下图： (2)… ．， ()… ．， (Ⅳ))，为测试语音帧号，模式中共包语括Ⅳ 帧语音，T(H)为第，z帧特征矢量。为了比较孵口川构相似度，可以计算它们之间的失真，失真越小则相似度越高．为了计算这一失真，应从T；~HR中对应帧的失真算起．设”和分别为聊中任意选择的帧号， (n)， )】表示这两帧特征矢量的失真度，则可按图表 1 照不同的情况求出模板中每帧之间的失真，从而计算总失真D(T，R)。 1 语音的识别 D 【】=∑ ：1饥 )，R()] 如设测试语音模板共有Ⅳ 帧矢量，而参考模板共有语音信号处理中的端点检测技术，是从包含语音的一段帧矢量，且Ⅳ≠ 则动态时间归正，就是寻找一个时间归正信号呻1确定出语音的起点以及结束点。有效的端点检测不仅函数m=w()，它将测试矢量的时间轴非线性的映射到模能使处理的时间减少到最少 (处理帧最少)，提高系统的处板的时间轴上，并使函数满足：理实时行，而且可以排除无声段的噪声干扰，从而使得后续 D R_，=lim ㈨∑ =1“【 )，(w ))】的识别性能得以提高。 D[T(n，R(n))]是测试模板第，z帧矢量 ()与参考模特征提取是语音识别的第一个重要环节。这个环节既是板第m帧矢量 )之问的距离。DTW 算法的实质就是运一个信息大幅度压缩的过程，也是一个信号解卷过程，目的用动态规~J1(DP)的思想，利用局部最佳化的处理来自动寻找是使模式划分器能更好地划分识别边界。特征提取就是要从条路径，沿着这条路径，两个特征矢量之间的累积失真量语音波形中提取出重要的反映语音特征的相关信息，而去掉最小，从而避免由于时间长度不同而可能引入的误差那些相对无关的信