- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
差分帧能量稳健语音信号活动性检测方法
摘要:针对噪声环境下常规算法检测准确度下降的问题,提出了一种基于滑动滤波器差分能量输出的稳健语音信号活动性检测方法。利用历史帧信息,使用滑动滤波器对多帧能量进行滤波,根据滤波输出进行阈值决策,设计了一个三态有限状态机,将语音信号分成有声、无声与过渡三种状态,其中过渡态由三个子状态构成,各个子状态之间可以依条件相互跳转,达到吸收高能量平稳噪声和突发噪声的目的。此外,算法在输出判决中引入了滤波器输出能量的一阶差分成分,提高了算法的动态性能。实验结果表明,论文算法的活动性检测结果明显优于传统帧能量判决方法,并对不同水平的噪声干扰具有鲁棒性。
关键词:语音活动性检测;滑动滤波器;有限状态机;一阶差分
中图分类号:TP391.4文献标识码:A文章编号:1009-3044(2009)31-pppp-0c
A Robust VAD Method Using Differential Frame Energy
ZHANG Wei-wei
(School of Electronic and Information Engineering, Lanzhou Jiaotong University, Lanzhou 730070, China)
Abstract: A robust Voice Activity Detect(VAD) algorithm is presented using differential frame energy output.. Moving Average Filter is used to filter the frame energies and get the output compared with pre-decided threshold, based on which the current frame is labeled as speech、noise and transition status. Three sub-status are designed to eliminate the effect of impulse noise and high level stationary noise. First Order Difference of Moving Average Filter is used to get more comformable results in start point and end point detection. Simulation shows that the proposed algorithm outperformes traditional energy-based VAD algorithms and is robust in detecting voice activities under different SNR levels.
Key words: voice activity detect; moving average filter; finite state machine; first order difference
活动性检测(Voice Activity Detect)又称端点检测,在语音信号数字处理当中具有十分重要的作用。包括语音识别、说话人识别与确认、语音合成、语音编解码等各种应用在内,都离不开语音活动性检测[1]。对于语音识别以及说话人识别与确认系统而言,如果端点检测的结果不够准确,系统的识别性能就得不到保证,另外,如果语音端点检测的结果过于放松,则会增加过多的静音部分,造成系统运算量的增加,同时对识别结果也具有负面影响[2]。
传统的语音活动性检测方法主要采用语音信号的基本短时参数:短时能量、过零率等。汉语中的浊音部分短时能量和清音部分短时能量在有声\无声段的区别明显。经过大量的实验,可以统计出短时能量和过零率在有声段和无声段的区别,从而设定阈值,决定当前语音帧属于有声段还是无声段[1]。但是,这种方法在噪声环境中的判别性能有所下降,当信噪比低于一定程度的时候,甚至无法得到正确的判别结果,对于大多数实际应用系统来说,这个问题显得尤其重要。论文提出了一种噪声环境下稳健的语音活动性检测方法,该方法对于不同噪声水平的环境下的语音活动性检测具有很好的鲁棒性。
1 算法流程
论文算法的系统结构如图1所示。
1)窗选帧能量:对输入语音信号进行分帧、加汉明窗,并在一个队列结构当中保存相邻的M帧能量作为滑动滤波器的输入。
2)滑动平均滤波器:常规的M阶时域滑动平均滤波器定义为M个采样的算术平均,
您可能关注的文档
- 安钢进口矿石业务管理系统的设计与实现.doc
- 爱尔兰国立高威大学计算机教育中的实践特色.doc
- 安广院电视台机房设备环境远程监控系统设计.doc
- 安徽高速公路机电系统的技术节能实践.doc
- 安全和可控信息网的研究.doc
- 安全审计系统中日志数据整合的研究.doc
- 安全提防,谨防不起眼服务“惹祸”.doc
- 安全网关技术在企业中的应用.doc
- 案例教学+项目驱动模式在网页设计教学中的应用.doc
- 案例法和项目驱动法在“数据库原理”教学实践中的应用探索.doc
- 2025下半年四川绵阳安州区考核招聘医疗卫生专业技术人员7人备考试题及答案解析.docx
- 2025年湖州安吉雷博人力资源服务有限公司公开招聘2人备考试题及答案解析.docx
- 2025年甘肃省酒泉市玉门市人民法院招聘司法辅助人员笔试参考题库附答案解析.docx
- 2025年黑龙江哈尔滨“丁香人才周”(春季) 卫生健康系统专项招聘1人备考试题及答案解析.docx
- 2025年湖南科技大学第一批高层次人才招聘50人备考试题及答案解析.docx
- 2025年湖南中医药大学招聘72人备考试题及答案解析.docx
- 2025年江苏扬州市宝应县教育系统事业单位面向乡村定向师范生招聘教师78人备考试题及答案解析.docx
- 2025年巢湖黄麓师范学校编外聘用教师招聘11人笔试参考题库附答案解析.docx
- 2025年福州市平潭综合实验区实发教育咨询有限公司2025年下半年幼儿园教师招聘笔试参考题库附答案解析.docx
- 2025下半年黑龙江科技大学招聘博士教师92人备考试题及答案解析.docx
文档评论(0)