- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语音信号处理期末复习.ppt
考试时间和地点 12月26日(周四) 14:00-15:40 地点:4-202 复 习 课 第一章 绪论 第二章 语音信号处理的基础知识 第三章 语音信号的时域分析 语音信号的稳态——帧的概念 语音自身从长时间看是非稳态过程,从短时间看是相对稳定的,既“短时性”。 将语音分为一段一段的,每一段称为“一帧”,大概时间为10-30ms 短时时域分析是语音处理的基本方法,也是最直观、最易理解的方法 3.3短时能量分析 短时能量定义 短时:通过加窗来实现 能量:通过求信号幅度的平方来实现 窗的位置随n变化 窗的类型 直角窗(矩形窗) 窗的类型 海明窗(Hamming,也称汉明窗,升余弦) 时域比较 频域对比(注意纵坐标不同) 短时平均幅度Mn En需要将信号求平方,大信号急剧变大,要求动态范围大 Mn只是取绝对值,不需增加额外的动态范围 其功能与能量是一样的,区分清、浊音等 3.4短时过零分析 过零率 短时过零分析:过零率就是每秒内信号值通过零值的次数,短时过零就是指在一段时间内(一帧内)平均的过零率。 对于窄带信号,是很好的统计其频率特性的参数 最典型的是正弦波(单一频率) 3.5 短时相关分析 3.5.1 短时自相关函数 自相关函数 短时自相关函数 3.5.2 修正的短时自相关函数 为了解决窗口长度对自相关函数的影响 作业:计算 序列{0,1,2,3,0,1,2,3,0,1,2,3} 求: 1. 窗口长度为10的自相关函数 2. 窗口长度为6 的自相关函数 3. 窗口长度为6 的修正自相关函数 第四章 语音信号的频域分析 语音信号的频域分析 本质:加窗后进行傅里叶变换 适合语音的短时性 同时得到语音的时间、频率特性 时间分辨率与频谱分辨率 鱼和熊掌不能兼得!!! P36 下半部分 对于直角窗,频域第一个过零点 N越大,主瓣越窄,频率分辨率越高,但时域分辨率越低, 其实,当N大于一个语素,就失去分析的意义 语谱图 第五章 语音信号的同态分析 目前解卷的算法主要有两种 同态分析 线性预测分析 同态分析也称“倒谱分析” 解卷的原理 第六章 语音信号的线性预测分析 线性预测的概念 P61页 第四段 基本概念:一个(当前的)语音抽样值可以用过去若干个抽样值的线性组合来逼近。 线性组合的系数 可以通过计算采样值与预测值的差别(如最小均方误差)等方法得到。 第七章 语音信号的矢量量化 矢量量化的过程 以2维矢量量化为例 过程见黑板 重要的变量(p84最上面) 矢量译码 见黑板 传输中只传区域的代码Yi,数据量小,且具有一定的保密性 量化误差 第八章 隐马尔科夫模型(HMM) HMM的独到之处 我们已学过的所有算法(短时傅里叶,线性预测,……)都是基于平稳过程的 语音本身是时变的,不平稳的 所以需要将语音分帧 所以以上方法只能提取独立的帧内特征 HMM能掌握语音长时间的特性,不需要分帧 第9章 基音提取和共振峰估计 提取基音周期的方法 自相关法 并行处理法 倒谱法 线性预测谱 第十章 语音信号的波形编码 语音编码的分类(很重要) 分为:波形编码、声码器和混合型 常用波形编码方式 PCM,非均匀PCM 预测编码及其自适应APC 自适应差分脉冲编码调制(ADPCM)及自适应增量调试(ADM) 子带编码(SBC) 自适应变换编码(ATC) 数字化 分为两步:采样和量化 采样精度至少11bit(保证信噪比不低于60dB) 语音质量 广播质量 长途电话质量 通信质量 合成质量 10.3.2非均匀量化PCM A律和μ律 输出的数据率为64 kb/s。CCITT推荐的G.711标准 A律(A-Law)压扩(G.711)主要用在欧洲和中国大陆等地区的数字电话通信中 m 律(m -Law)压扩(G.711)主要用在北美和日本等地区的数字电话通信中 10.5.2 增量调制(DM)及ADM 增量调制(DM:Delta Modulation) 提高取样率后,只用1bit来量化 斜率过载 散弹噪声 第11章 声码器编码 第12章 语音合成 第13章 语音识别 第14章 说话人识别 定义 说话人识别是一类特殊的语音识别,其目的不在于讲话内容,而是提取个人的特征,识别说话人的身份信息。 考试时间和地点 12月26日(周四) 14:00-15:40 地点:4-202 谢谢大家一个学期的培伴!不仅祝大家取得好成绩!更衷心祝大家前程似锦! 倒谱的作用: (1)区分清/浊音 (2)求浊音的基音周期, 可以得到浊音的激励信号。 (3)得到声道的冲激响应h(n) 通道声码器,共振峰声码器,同态声码器,LPC声码器 时域:PCM,
您可能关注的文档
最近下载
- 《射频识别技术原理与应用实战》全套教学课件.pptx
- 羊的同期发情技术.pptx VIP
- T-CAGHP 035—2018地质灾害排水治理工程设计规范(试行).docx VIP
- 第二批重点监管危险化学品名录.doc VIP
- 劳技课件教学课件.pptx VIP
- Unit 1 I love sports Part 1 (课件)2025-2026学年度外研版(三起)英语四年级上册.pptx VIP
- DBJ43_T393-2022:湖南省房屋建筑和市政工程消防质量控制技术标准.pdf VIP
- 2024年-2025年政工师(初级)理论考试题库及答案(综合题型).pdf VIP
- T∕ZZB 0900-2018 液晶调光玻璃团体标准.pdf VIP
- 朗朗阅读周周练四年级上册(1).pdf VIP
文档评论(0)