- 1、本文档共39页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
数字语音处理及MATLAB仿真张雪英编著*数字语音处理及MATLAB仿真张雪英编著*11.1概述111.2语音感知特性和噪声特性11.3语音增强算法32在通信过程中语音受到来自周围环境、传输媒介引入的噪声,使接收到的语音信号并非纯净的原始语音信号,而是受噪声污染的带噪语音信号。这里的“噪音”定义为所需语音信号以外的所有干扰信号。干扰信号可以是窄带的或宽带的、白噪声的或有色噪声的、声学的或电学的、加性的或乘性的,甚至可以是其它无关的语音。由噪声导致的语音质量的下降会使许多语音处理系统的性能急剧恶化。010211.1概述010203采用语音增强技术进行预处理,可有效地改善系统性能。语音增强的目标:对收听人而言主要是改善语音质量,提高语音可懂度,减少疲劳感;对语音处理系统(识别器、声码器、手机)而言是提高系统的识别率和抗干扰能力。2.1语音特性语音信号具有短时平稳性声道形状有相对稳定性,在一段时间内(10ms~30ms),人的声带和声道形状是相对稳定的,可认为其特征是不变的,因而语音的短时谱具有相对稳定性,在语音分析中可以把语音信号分为若干分析帧,每一帧的语音可以认为是准稳定的。语音增强可以利用这种短时平稳性。11.2语音感知特性和噪声特性语音信号可以分为浊音和清音语音可以分为周期性的浊音和非周期性的清音。在语音增强中,可以利用浊音的周期性特征,采用梳状滤波器提取语音分量或者抑制非语音信号,而清音则难以与宽带噪声区分。语音信号可以利用统计分析特征描述作为一个随机过程,语音信号可以利用许多统计分析特征进行分析。语音的短时谱幅度统计特征是时变的,只有当分析帧长趋于无穷大时,才能近似具有高斯分布。在高斯模型的假设中,可以认为傅里叶展开系数是独立的高斯随机变量,均值为零,而方差是时变的。在有限帧长时这种高斯模型只是一种近似的描述,可以作为分析的前提在宽带噪声污染的带噪语音增强中应用。人耳对语音的感知主要是通过语音信号频谱分量幅度获取的,对各分量相位则不敏感,对频率高低的感受近似与该频率的对数值成正比。人耳具有掩蔽效应,人耳除了可以感受声音的强度、音调、音色和空间方位外,还可以在两人以上的讲话环境中分辨出所需要的声音,这种分辨能力是人体内部语音理解机制具有的一种感知能力。人类的这种分离语音的能力与人的双耳输入效应有关,称为“鸡尾酒会效应”。2.2人耳感知特性STEP1STEP2根据与输入语音信号的关系,噪声可分为加性噪声和非加性噪声两类。对某些非加性噪声而言,可以通过一定的变换转换成加性噪声。语音处理中的加性噪声大体上可以分为周期性噪声、脉冲噪声、宽带噪声和同声道其他语音的干扰等。11.2.3噪声特性周期性噪声周期性噪声主要来源于发动机等周期性运转的机械,电气干扰也会引起周期性噪声。特点是频谱上有许多离散的线谱。实际信号受多种因素的影响,线谱分量通常转变为窄带谱结构,而且通常这些窄带谱都是时变的,位置也不固定。必须采用自适应滤波的方法才能有效地区分这些噪声分量。脉冲噪声脉冲噪声来源于爆炸、撞击、放电及突发性干扰等。特征是时间上的宽度很窄。在时域消除脉冲噪声过程如下:根据带噪语音信号幅度的平均值确定阈值。当信号超出这一阈值时判别为脉冲噪声。然后对信号进行适当的衰减,就可完全消除噪声分量,也可以使用内插方法将脉冲噪声在时域上进行平滑。宽带噪声01宽带噪声来源很多,热噪声、气流噪声及各种随机噪声源、量化噪声都可以视为宽带噪声。宽带噪声与语音信号在时域和频域上基本上重叠,只有在无话期间,噪声分量才单独存在。因此消除这种噪声比较困难。02对于平稳的宽带噪声,通常可以认为是白色高斯噪声。0303处理这种噪声可以采用同态处理的方法,把非加性噪声变换为加性噪声来处理。02这是传输系统的电路噪声。01传输噪声通过语音增强技术改善语音质量的过程如下图所示:目前语音增强算法大致可以分为四种:01参数方法02非参数方法03统计方法04其它方法0511.3语音增强算法图11.2语音的全极点生成模型语音的全极点生成模型如图所示:11.3.2非参数方法设带噪语音输入为y(n)=s(n)+d(n),s(n)为语音信号,d(n)为未知噪声信号,r(n)参考噪声输入,也即自适应滤波器的输入,v(n)是该滤波器的输出。r(n)与s(n)无关,而与d(n)相关。自适应滤波器原理:在输入过程的统计特性未知或是输入过程的统计特性变化时,能够调整自己的参数,以满足某种最佳准则的要求。自适应滤波的目的就是通过对r(n)的滤波,使输出的噪声估值v(n)尽可能接近带噪语音中的d
您可能关注的文档
- 预包装食品营养标签通则.ppt
- 语言习得入门第三章讲解.ppt
- 语言学概论课件第一二章.ppt
- 进排气系统及排气净化装置.ppt
- 隧道工程质量控制要点.ppt
- 营销员行为规范与职业道德.ppt
- 轴功及各种热效应的计算.ppt
- 项目四信用证业务:申请开证和开证.ppt
- 音乐中的故事第课时.ppt
- 西方哲学智慧13康德哲学.ppt
- 在区政协DeepSeek政务应用培训会上的讲话.docx
- 在市政府办DeepSeek软件应用培训会议上的讲话.docx
- 街道2025年清明节期间森林防灭火工作实施方案.docx
- 在“DeepSeek赋能检察工作”专题培训会上的讲话.docx
- 某国企关于深入贯彻中央八项规定精神学习教育工作方案.docx
- 在宣传部理论学习中心组深入贯彻中央八项规定精神学习教育专题研讨会上的交流发言.docx
- 市委书记在市委理论学习中心组深入贯彻中央八项规定精神学习教育读书班上的讲话.docx
- 某县委办公室党员干部在2025年度学习教育读书班上关于作风建设的研讨发言材料.docx
- 在DeepSeek赋能教育高质量发展专题培训会上的讲话.docx
- 市总工会开展深入贯彻中央八项规定精神学习教育工作方案.docx
最近下载
- 工程造价咨询服务管理制度、工作纪律、协调服务.docx VIP
- 上海摩根碳刷资料.pdf VIP
- 2025年江苏信息职业技术学院单招职业倾向性测试题库及参考答案1套.docx
- 2024年长期照护师职业技能竞赛理论考试题库(含答案).pdf VIP
- 【2026春】人教版五年级下册道德与法治教学工作计划(及进度表).docx
- 福建图集-闽2016-J-41 烧结煤矸石多孔砖、多孔砌块墙体构造.pdf
- 2024年中考道德与法治一轮总复习课件: 革命文化(36张PPT).pptx VIP
- 把字句与被字句相互转换练习题.docx
- 深入贯彻中央八项规定精神学习教育党课:中央列出80条违反八项规定清单PPT.pptx VIP
- 质量及安全保证措施.pdf
文档评论(0)