语音信号处理DTW.docxVIP

下载本文档

11
0
约1.96千字
约 4页
2018-03-07 发布于河南
举报

语音信号处理DTW.docx

语音信号处理DTW

搜了半天，竟然没有关于DTW（动态时间规整）的blog，于是打算自己写一篇以语音识别为例：整个语音信号的端点检测可以分为四段：静音、过渡段、语音段、结束。程序中使用一个变量status来表示当前所处的状态。在静音段，如果能量或过零率超越了低门限，就应该开始标记起始点，进入过渡段。在过渡段中，由于参数的数值比较小，不能确信是否处于真正的语音段，因此只要两个参数的数值都回落到低门限以下，就将当前状态恢复到静音状态。而如果在过渡段中两个参数中任意一个超过了高门限，就可以确信进入语音段了。一些突发性的噪声可以引发短时能量或过零率的数值很高，但是往往不能维持足够长的时间，这些可以通过设定最短时间门限来判别。当前状态处于语音段时，如果两个参数的数值降低到低门限以下，而且总的计时长度小于最短时间门限，则认为这是一段噪音，继续扫描以后的语音数据。否则就标记好结束端点，并返回在孤立词语音识别中，最为简单有效的方法是采用DTW动态时间规整算法，设参考模板特征矢量序列为A={a1，a2，…，aj)，输入语音特征矢量序列为B={b1，b2，…，bk}，j≠k。DTW算法就是要寻找一个最佳的时间规整函数，使得语音输入B的时间轴K映射到参考模板A的时间轴j上总的累计失真最小。将己经存入模板库的各个词条称为参考模板，一个参考模板可以表示为{R(1)，R(2)，…，R(M)}，m为训练语音帧的时序标号，m=1为起

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

语音信号处理DTW.docxVIP