- 11
- 0
- 约1.96千字
- 约 4页
- 2018-03-07 发布于河南
- 举报
语音信号处理DTW
搜了半天,竟然没有关于DTW(动态时间规整)的blog,于是打算自己写一篇以语音识别为例:整个语音信号的端点检测可以分为四段:静音、过渡段、语音段、结束。程序中使用一个变量status来表示当前所处的状态。在静音段,如果能量或过零率超越了低门限,就应该开始标记起始点,进入过渡段。在过渡段中,由于参数的数值比较小,不能确信是否处于真正的语音段,因此只要两个参数的数值都回落到低门限以下,就将当前状态恢复到静音状态。而如果在过渡段中两个参数中任意一个超过了高门限,就可以确信进入语音段了。一些突发性的噪声可以引发短时能量或过零率的数值很高,但是往往不能维持足够长的时间,这些可以通过设定最短时间门限来判别。当前状态处于语音段时,如果两个参数的数值降低到低门限以下,而且总的计时长度小于最短时间门限,则认为这是一段噪音,继续扫描以后的语音数据。否则就标记好结束端点,并返回在孤立词语音识别中,最为简单有效的方法是采用DTW动态时间规整算法,设参考模板特征矢量序列为A={a1,a2,…,aj),输入语音特征矢量序列为B={b1,b2,…,bk},j≠k。DTW算法就是要寻找一个最佳的时间规整函数,使得语音输入B的时间轴K映射到参考模板A的时间轴j上总的累计失真最小。将己经存入模板库的各个词条称为参考模板,一个参考模板可以表示为{R(1),R(2),…,R(M)},m为训练语音帧的时序标号,m=1为起
您可能关注的文档
最近下载
- 2026年版-心力衰竭诊断和治疗指南解读与总结2026-新版课件.pptx
- 武汉市2026届高三年级四月供题(武汉四调)数学+答案.docx
- 森林疗愈培训课件.pptx VIP
- 云南省楚雄彝族自治州2024-2025学年五年级下册期末考试语文试卷(有答案).pdf VIP
- CN112457205A 一种从麻黄草中提取麻黄碱的方法 (北京亚东生物制药有限公司).pdf VIP
- 低血糖症护理常规 (2).pptx VIP
- REX温控器_-_REX-C700_实用文档.doc VIP
- 2026中国南方电网校园(土木类)训练题及答案.docx VIP
- 疗愈时光音乐.pptx VIP
- 北京市东城区2025-2026学年高二上学期期末考试政治试卷含答案.docx
原创力文档

文档评论(0)