- 1、本文档共51页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《语音信号处理》讲稿第4章.ppt
第4章 语音分析 本章主要讨论的问题: 1.语音分析方法概述 2.语音的时域分析 3.语音的频域分析 4.语音的语谱分析 1.语音分析方法概述 语音分析是语音合成及语音识别的基础。 语音分析的三种方法: (1)时域分析法——时域波形图。 (2)频域分析法——频谱图。 (3)语谱分析法——语谱图。 1.语音分析方法概述 (1)时域分析法 语音的时域分析采用时域波形图。横坐标是时间,纵坐标是幅值。 1.语音分析方法概述 (2)频域分析法 频域分析包含:语音信号的频谱、功率谱、倒频谱、频谱包络、短时间谱等。 常用的频域分析方法有: a.带通滤波器组法。 b.傅里叶变换法。 c.线性预测法等。 1.语音分析方法概述 (3)语谱分析法 语谱分析法是另一种用于语音分析的有效方法。语谱分析法始于20世纪40年代,当时研制成功语谱仪,能生成语谱图。 语谱图可以在二维(时间及频率)图上表示音强的关系,提供了有关不同时间不同频率的相对音强的有价值的信息。 2.语音的时域分析 三种常用的时域分析方法: (1)过零分析 (2)幅度分析 (3)相关分析 2.语音的时域分析 (1)过零分析 所谓过零,是指对于有时间横轴的连续语音信号,可观察到语音的时域波形通过横轴的情况。在离散时间语音信号情况下,若相邻的采样具有不同的代数符号,就称为发生了过零。 2.语音的时域分析 ①几类典型的过零率 a.过零率——单位时间内过零的次数。 b.平均过零率——一段时间内过零率。对于窄带信号,平均过零率是信号频率量的一个简单度量。 2.语音的时域分析 c.短时平均过零率。 2.语音的时域分析 语音的短时处理的一个重要问题是采样个数N 的取值。 由于人类听觉范围为20Hz~20kHz,因此,采样频率f s为10kHz可以满足语音处理要求。若女性、男性的音调分别对应为 400~80Hz,则在采样频率f s为10kHz情况下,采样个数N为 25~125。 2.语音的时域分析 ②短时平均过零率的应用 a.区别清音和浊音。 例如,清音的过零率高,浊音的过零率低。此外,清音和浊音的两种过零分布都与高斯分布曲线比较吻合。 清音和浊音的过零分布 2.语音的时域分析 b.从背景噪声中找出语音信号。 语音处理领域中的一个基本问题是,如何将一串连续的语音信号进行适当的分割,以确定每个单词语音的信号,亦即找出每个单词的开始和终止位置。 在孤立词的语音识别中,可利用能量和过零作为有话无话的鉴别。 2.语音的时域分析 ③过零分析的缺陷 有些单词仅用过零率无法判定语音的开始和终止。 解决办法:结合过零率和信号能量分析(如幅度分析)。 2.语音的时域分析 (2)幅度分析 幅度分析用于估计语音信号的特征。清音段幅度较小,能量集中于高频段;浊音段幅度较大,能量集中于低频段。 幅度分析包括两方面: ①幅度 ②能量 由于语音信号的宽带特点,采用短时处理技术。 2.语音的时域分析 ①短时能量函数 短时能量函数定义: 式中,h(n)= ?2(n)为窗函数。 2.语音的时域分析 两种典型窗函数:矩形窗、哈明(Hamming)窗。 a.矩形窗的定义: h(n)= 1, 0 ≤ n ≤ N-1 h(n)= 0, 其他 b.哈明窗的定义: h(n)= 0.54-0.64cos(2∏n/(N-1)), 0≤n≤ N-1 h(n)= 0, 其他 2.语音的时域分析 矩形窗的频率响应如下式所示: 通过矩形窗,可以求出哈明窗的频率响应。 2.语音的时域分析 实验表明,在用短时能量反映语音信号的幅度变化时,不同的窗函数以及相应窗的长短均有影响。哈明窗的效果比矩形窗略好。但是,窗的长短影响起决定性作用。 窗过大(N很大),等效于很窄的低通滤波器,不能反映幅度En的变化;窗过小(N很小),短时能量随时间急剧变化,不能得到平滑的能量函数。在10kHz的采样频率下,N选为100~200比较合适。 2.语音的时域分析 小结:短时能量函数的应
您可能关注的文档
- 畅言智能语言教学系统的入门操作-刘波.ppt
- 文化词语的翻译.ppt
- 绿紫色调线条风格PPT 238553.ppt
- 时间管理72717.doc
- 第2章 市场环境分析27563.ppt
- 第三讲 古希腊艺术.ppt
- 简笔画写生与改编.ppt
- 政府经济学第六章.ppt
- 羽毛球协会简介.ppt
- 沟通的方法待人的技巧.doc
- 最新2025评标专家测试题库.docx
- 医院信息科培训课件.ppt
- 最新2025年实验室生物安全培训测试题(+答案).docx
- 2025化工技能鉴定高分题库【必考】附答案详解.docx
- 2025年湖北省襄樊市选调生考试(行政职业能力测验)综合能力测试题必考题.docx
- 2025社工(初级)考试题库含答案【推荐】.docx
- 2025年湖北省襄樊市选调生考试(行政职业能力测验)综合能力测试题最新.docx
- 2025化工技能鉴定题库(实用)附答案详解.docx
- 2025年湖北省襄樊市选调生考试(行政职业能力测验)综合能力测试题审定版.docx
- 2025年湖北省鄂州市行政职业能力测验题库含答案.docx
文档评论(0)