- 1、本文档共44页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第四章语音信号的时域分析
国家“十一五”规划教材
《数字语音编码》讲议
同济大学电子与信息工程学院
赵晓群 编著
机械工业出版社,2007年
;第4章 语音信号的时域分析;第4章 语音信号的时域分析
4.1 概述
语音信号携带各种信息:男声、女声,喜、怒,中、英等。
不同场合感兴趣的信息不同;
◆判断信号是否为语音,只需人类语音信号的一般特征;
◆区分语音为清、浊音,需语音能量谱和基频;
◆数字传输或数字存储时,目的不同,保留信息精度不同;
语音信号处理的任务:
◆去除与应用目的不相干或影响不大的语音信息
◆需要的信息不仅应当提取出来,有时还需要加强。
以上涉及语音信号中,各种信息的表示问题。
表示方法的原则:最方便、最有效。
短时分析技术贯穿于语音分析的全过程。;整体的语音信号来讲,分析出的是由每一帧特征参数组成的特征参数时间序列。
语音信号分析:时域分析、频域分析、倒频域分析等;
语音信号分析:模型分析、非模型分析;
模型分析法是指依据语音信号产生的数学模型,来分析和提取表征这些模型的特征参数,
◆模型分析:共振峰分析、无损级联声管分析法
◆非模型分析:不进行模型化的分析
语音的预处理:语音信号的数字化、语音信号的端点检测、
预加重、加窗、分帧等,
本章重点:语音信号的各种时域分析技术,是语音处理技术
的基础知识。;第4章 语音信号的时域分析
4.2 语音信号的数字化和预处理
信号数字化:放大、增益控制、反混叠滤波、取样、
A/D变换及编码(PCM编码);
预处理:预加重、加窗、分帧、端点检测等;
图4.1:语音信号数字分析或处理的系统框图。
; 4.2.1 预滤波、取样、A/D变换
预滤波:带通滤波器(上、下截止频率为fH、fL)
◆防混叠滤波,抑制fs/2的输入信号分量(fs为取样频率)
◆抑制工频干扰(50 Hz电源)。
多数语音编/译码器: fH = 3.4kHz, fL = 60~100Hz,fs= 8kHz。
语音识别:◆对电话用户指标与语音编/译码器时相同;
◆要求较高或很高: fH=4.5 or 8kHz, fL=60Hz, fs = 10 or 20kHz。
A/D变换需对信号量化,编码为二进制,产生量化误差。
量化误差(量化噪声):量化信号值与原信号值之差;
信号波形的变化足够大或量化间隔足够小时,
量化噪声符合具有下列特征的统计模型:
① 量化噪声是平稳的白噪声过程;
② 量化噪声与输入信号不相关;
③ 量化噪声在量化间隔内均匀分布,即具有等概率密度分布。;量化信噪比SNR(信号与量化噪声的功率比)为:
式中, ——输入语音信号序列的方差,
——噪声序列的方差,
——信号的峰-峰值, B——量化字长,
设语音信号的幅度服从Laplace分布,则
取 , 上式改写为:
B=7 bit,SNR=35 dB,能满足一般通信系统的要求。
语音波形的动态范围达55 dB,故B应取10 bit以上。
为保持35 dB的信噪比,常用12 bit量化,附加的5 bit用于补偿30 dB左右的输入动态的变化。 ;A/D变换器:分为线性和非线性两类。
目前采用绝大部分的线性A/D变换器是12 bit。
非线性A/D变换器一般是8 bit,它与12 bit线性变换器等效。
有时需要将非线性的8 bit码转换为线性的12 bit码。
数字化的反过程是从数字化语音中重构语音波形。
必须在D/A后加平滑滤波器,对重构的语音波形的高次谐波起平滑作用,以去除高次谐波失真。
预滤波、取样、A/D和D/A变换、平滑滤波等许多功能可以用一块芯片完成,在市场上有多种这样的集成芯片供选用。; 4.2.2 预处理
预处理:预加重、加窗、分帧、端点检测等;
语音的一个特征:约8 kHz高频端按-6 dB/倍频程跌落。
预加重:提升语音的高频部分,使信号的频谱变得平坦,
◆可在反混叠滤波前,可压缩动态范围,提高信噪比。
◆也可在数字化后、参数分析之前。
预加重用6 dB/倍频程的提升高频特性的预加重数字滤波器:
式中,μ为常系数,值接近于1,通常取μ= 0.92~0.94。
恢复原信号,对测量值进行去加重处理,
即加上-6 dB/倍频程的下降的频率特性来还原成原来的特性。 ; 4.2.3 窗函数的作用
采用连续分段或交叠分段的方法分帧,33 ~ 100帧/秒。
图4.2
文档评论(0)