第四章语音信号的时域分析.pptVIP

下载本文档

161
0
约8.27千字
约 44页
2017-04-20 发布于北京
举报
版权申诉

第四章语音信号的时域分析.ppt

1、本文档共44页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第四章语音信号的时域分析

国家“十一五”规划教材《数字语音编码》讲议同济大学电子与信息工程学院赵晓群　编著机械工业出版社，2007年 ;第4章　语音信号的时域分析;第4章　语音信号的时域分析 4.1　概述语音信号携带各种信息：男声、女声，喜、怒，中、英等。不同场合感兴趣的信息不同； ◆判断信号是否为语音，只需人类语音信号的一般特征； ◆区分语音为清、浊音，需语音能量谱和基频； ◆数字传输或数字存储时，目的不同，保留信息精度不同；语音信号处理的任务： ◆去除与应用目的不相干或影响不大的语音信息 ◆需要的信息不仅应当提取出来，有时还需要加强。以上涉及语音信号中，各种信息的表示问题。表示方法的原则：最方便、最有效。短时分析技术贯穿于语音分析的全过程。;整体的语音信号来讲，分析出的是由每一帧特征参数组成的特征参数时间序列。语音信号分析：时域分析、频域分析、倒频域分析等；语音信号分析：模型分析、非模型分析；模型分析法是指依据语音信号产生的数学模型，来分析和提取表征这些模型的特征参数， ◆模型分析：共振峰分析、无损级联声管分析法 ◆非模型分析：不进行模型化的分析语音的预处理：语音信号的数字化、语音信号的端点检测、预加重、加窗、分帧等，本章重点：语音信号的各种时域分析技术，是语音处理技术的基础知识。;第4章　语音信号的时域分析 4.2　语音信号的数字化和预处理信号数字化：放大、增益控制、反混叠滤波、取样、 A/D变换及编码（PCM编码）；预处理：预加重、加窗、分帧、端点检测等；图4.1：语音信号数字分析或处理的系统框图。 ; 4.2.1　预滤波、取样、A/D变换预滤波：带通滤波器（上、下截止频率为fH、fL） ◆防混叠滤波，抑制fs/2的输入信号分量（fs为取样频率） ◆抑制工频干扰（50 Hz电源）。多数语音编/译码器： fH = 3.4kHz， fL = 60~100Hz，fs= 8kHz。语音识别：◆对电话用户指标与语音编/译码器时相同； ◆要求较高或很高： fH=4.5 or 8kHz, fL=60Hz, fs = 10 or 20kHz。 A/D变换需对信号量化，编码为二进制，产生量化误差。量化误差（量化噪声）：量化信号值与原信号值之差；信号波形的变化足够大或量化间隔足够小时，量化噪声符合具有下列特征的统计模型： ① 量化噪声是平稳的白噪声过程； ② 量化噪声与输入信号不相关； ③ 量化噪声在量化间隔内均匀分布，即具有等概率密度分布。;量化信噪比SNR（信号与量化噪声的功率比）为：式中， ——输入语音信号序列的方差， ——噪声序列的方差， ——信号的峰-峰值， B——量化字长，设语音信号的幅度服从Laplace分布，则取，上式改写为： B=7 bit，SNR=35 dB，能满足一般通信系统的要求。语音波形的动态范围达55 dB，故B应取10 bit以上。为保持35 dB的信噪比，常用12 bit量化，附加的5 bit用于补偿30 dB左右的输入动态的变化。 ;A/D变换器：分为线性和非线性两类。目前采用绝大部分的线性A/D变换器是12 bit。非线性A/D变换器一般是8 bit，它与12 bit线性变换器等效。有时需要将非线性的8 bit码转换为线性的12 bit码。数字化的反过程是从数字化语音中重构语音波形。必须在D/A后加平滑滤波器，对重构的语音波形的高次谐波起平滑作用，以去除高次谐波失真。预滤波、取样、A/D和D/A变换、平滑滤波等许多功能可以用一块芯片完成，在市场上有多种这样的集成芯片供选用。; 4.2.2　预处理预处理：预加重、加窗、分帧、端点检测等；语音的一个特征：约8 kHz高频端按-6 dB/倍频程跌落。预加重：提升语音的高频部分，使信号的频谱变得平坦， ◆可在反混叠滤波前，可压缩动态范围，提高信噪比。 ◆也可在数字化后、参数分析之前。预加重用6 dB/倍频程的提升高频特性的预加重数字滤波器：式中，μ为常系数，值接近于1，通常取μ= 0.92~0.94。恢复原信号，对测量值进行去加重处理，即加上-6 dB/倍频程的下降的频率特性来还原成原来的特性。 ; 4.2.3　窗函数的作用采用连续分段或交叠分段的方法分帧，33 ~ 100帧/秒。图4.2