- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
在语音信号处理中,傅里叶表示一直起主要作用。其原因在于:一方面,稳态语音的生成模型由线性系统组成,此系统由一个随时间周期变化或随机变化的源所激励,因而系统输出频谱反映了激励与声道频率响应特性;另一方面,语音信号的频谱具有非常明显的语言声学意义,可以获得某些重要的语音特征(如共振峰频率和带宽等)。 语音信号是非平稳信号,其非平稳性是由发音器官的物理运动过程而产生的。这个运动过程与声波振动的速度比起来要缓慢得多,因此可以假定它在10~30 ms这样短的时间段内是平稳的。所以对语音信号处理来说,短时分析的方法是有效的。短时分析应用于频域分析就是短时傅里叶变换,相应的频谱称为“短时谱”,即有限长度的傅里叶变换。 从广义上讲,语音信号的频域分析包括语音信号的频谱、频谱包络、功率谱、倒频谱等。常用的频域分析方法有带通滤波器组法、傅里叶变换法、线性预测法等几种。本节介绍语音信号的傅里叶分析法。 短时傅里叶变换最重要的应用是语音分析与合成系统,因为由短时博里叶变换可以精确地恢复语音波形。 它实际上是Xn(e-jω)在频域内的采样。上述两式的物理意义如下: ● 当n固定不变时,例如,n=n0,则是将窗函数的中心移至 n0处截取信号x(n),再进行傅里叶变换而得到的一个频谱函数。 ● 当频率固定时,例如ω=ω0,则Xn(ejω)可看作是信号经过一个中心频率为ω0的带通滤波器后产生的输出。 3.3 傅里叶变换的解释 3.3.1频谱解释 对于短时傅里叶变换 同时功率谱Sn(ejω)是短时自相关函数的傅里叶变换。 根据卷积定理,有 由上式可知,当n固定时,例如n=n0,则Xn0 (e-jω)是将窗函数的中心移至n处截取信号x(n),再进行傅里叶变换而得到的一个频谱函数。 3.3.2 滤波器解释 可以从线性滤波角度对Xn(e-jω)进行解释。为此,将短时傅里叶变换的定义式写为 3.4 短时傅里叶反变换 3.4.1 滤波器组求和法 这种方法与短时频谱的滤波器组表示有关。对于某个频率ωk,如果已知Xn(ejω),则有 考察整个带通滤波器组,其中每个带通滤波器均有相同输入,将其输输出相加,即得恢复信号 3.5语音识别的一般技术 3.5.1 语音识别基本原理 语音识别系统本质上是一种多维模式识别系统,基本结构如图3.4所示。语音识别系统与一般的模式识别系统类似,包括特征提取、语音模式库、模式匹配3个基本单元。 1、预处理 预处理包括预加重、反混叠滤波、模/数转换、自动增益控制等处理过程,用以去除声门激励、口鼻辐射、高于1/2采样频率的高频和噪声信号的影响,实现语音信号的数字化。在语音识别中,预处理还包括在声学参数分析之前正确选择识别基本的问题。 2、特征提取 可选择的语音特征参数具体如下: 时域参数 包括短时平均过零率、短时平均幅度或短时平均能量、基音周期。 频域参数 包括短时频谱(有10~30个通道滤波器组的平均谱、DFT频谱、模仿人耳听觉频率特性的MEL谱等)、前3个共振峰(有幅度、频率、带宽)、倒谱、线性预测系数、PARCOR系数(偏自相关系数)。 其他参数 包括声道的形状函数(用于求取讲话者的个性特征)、随机模型(即隐马尔可夫模型)的概率函数、矢量量化的矢量。 超音段信息函数 包括音长、音调、音色等。 3、语音模型库 语音模型库即声学参数模板,它是用聚类分析等方法,从一个讲话者或多个讲话者的多次重复的语音参数,经过长时间的训练得到的。 4、模式匹配 将输入语音的特征参数同训练得到的语音模式库进行比较分析,从而得到初步识别结果。根据模式识别方法的不同,用于语音识别系统时有统计模式识别法和句法模式识别法两类。 5、后处理 在大词汇量连续语音识别系统中,为了提高识别正确率需要使用语言模型,利用语音识别单位之间连接时的相互制约的关系,采取统计方法与语法相结合的方法建立语言模型,达到限制识别器译码时的自由度,提高系统的性能。目前后处理在嵌入式语音系统中还很难使用。 3.5.2 孤立词识别系统 孤立词识别系统的结构比较简单,其原理框图如图3.6所示。
您可能关注的文档
- 酒品鉴赏与服务 教学课件 作者 陈秋萍 第十二章 酒的品评.ppt
- 酒品鉴赏与服务 教学课件 作者 陈秋萍 第十一章软饮料.ppt
- 酒品鉴赏与服务 教学课件 作者 陈秋萍 第十章混合酒.ppt
- 安装工程预算与施工组织管理 教学课件作者 邢玉林 第八章.pdf
- 办公软件实训教程 教学课件作者 陈颖 Access 2003 案例4 同学信息我美化——窗体应用.pdf
- 银行产品营销与服务 教学课件 作者 裘燕南 模块一.ppt
- 办公软件实训教程 教学课件作者 陈颖 Excel 2003 案例6 “我”的特长(二)——公式与函数.pdf
- 银行电子化业务 教学课件 作者张一梅 模块1.ppt
- 办公软件实训教程 教学课件作者 陈颖 Excel 2003 案例7 我帮老师来评比——排序、筛选、汇总.pdf
- 银行电子化业务 教学课件 作者张一梅 模块2.ppt
- 连锁企业门店营运管理 教学课件 作者 胡启亮 01-项目一 门店营运管理概述.ppt
- 语音信号及单片机处理 教学课件 作者 吴黎明 主编 王桂棠 吴正光 副主编 第十二章.ppt
- 连锁企业门店营运管理 教学课件 作者 胡启亮 02-项目二 门店的组织结构与人员配置.ppt
- 语音信号及单片机处理 教学课件 作者 吴黎明 主编 王桂棠 吴正光 副主编 第十三章.ppt
- 连锁企业门店营运管理 教学课件 作者 胡启亮 03-项目三 门店长的作业化管理.ppt
- 语音信号及单片机处理 教学课件 作者 吴黎明 主编 王桂棠 吴正光 副主编 第十章.ppt
- 连锁企业门店营运管理 教学课件 作者 胡启亮 04-项目四 理货员与营业员作业管理.ppt
- 语音信号及单片机处理 教学课件 作者 吴黎明 主编 王桂棠 吴正光 副主编 第四章.ppt
- 连锁企业门店营运管理 教学课件 作者 胡启亮 05-项目五 门店收银作业管理.ppt
- 语音信号及单片机处理 教学课件 作者 吴黎明 主编 王桂棠 吴正光 副主编 第五章.ppt
文档评论(0)