- 1、本文档共40页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
装置构成;详细步骤;诊断疾病明细;输入与AD转换;求取声音数字信号参数MFCC (Mel-Frequency Cepstrum Coefficient);计算与参考模块的相似度Viterbi Decoder;计算、学习、训练参考模块 HMM (Hidden Markov Model);得出诊断结果;语音特征提取;MFCC的分析符合人类的听觉特性,人耳具有一些特殊的功能,能在嘈杂的环境中以及各种异变情况下分辨出各种语音,其中耳蜗起了关键作用 .
耳蜗实质上就相当于是一个滤波器组,耳蜗滤波作用是在对数频率尺度上进行的,1 000 Hz以下是线性尺度,1 000 Hz以上是对数尺度,这就使人耳对高频敏感.根据这一原则研究了一组类似于人耳蜗作用的滤波器即Mel频率滤波器.
MFCC是使用傅立叶分析提取的语音特征参数,是类似于指数的形式,它和实际频域之间的关系见下式.
[1] [2]
式中,Fmel是以MEL为单位的感知频域 ,FHz是以Hz为单位的实际频域.将语音信号的频谱变换到感知频域中,能更好地进行模拟听觉过程的处理.
----《MFCC和LPCC特征参数在说话人识别中的研究》[1]
----《Speech Production Based on the Mel-Frequency Cepstral Coefficients》[2];MFCC分析;预加重:通过一个一阶有限激励响应高通滤波器,使信号的频谱变得平坦,不易受到有限字长效应的影响。预加重用于消除唇辐射的影响和声门效应,进行高频提升。
分帧:根据语音的短时平稳特性,语音可以以帧为单位进行处理,实验中选取的语音帧长为25ms,帧叠为10ms。
加窗:采用hamming窗对一帧语音加窗,以减小吉布斯效应的影响。
快速傅立叶变换(Fast Fourier Transformation, FFT):将时域信号变换成为信号的功率谱。
三角窗滤波:用一组Mel频标上线性分布的三角窗滤波器(共24个三角窗滤波器),对信号的功率谱滤波,每一个三角窗滤波器覆盖的范围都近似于人耳的一个临界带宽,以此来模拟人耳的掩蔽效应。
求对数:对三角窗滤波器组的输出求取对数,可以得到近似于同态变换的结果。
离散余弦变换(Discrete Cosine Transformation, DCT):去除各维信号之间的相关性,将信号映射到低维空间。
倒谱均值减(Cepstrum Mean Subtraction, CMS):CMS可以有效地减小语音输入信道对特征参数的影响。
差分参数:大量实验表明,在语音特征中加入表征语音动态特性的差分参数,能够提高系统的识别性能。
线性鉴别分析(linearity distinction analysis) ;注释;--《基于乘积HMM的双模态语音识别方法》;MFCC分析;LSP算法分析;LSP 线性频谱对(Line Spectrum Sairs);线谱对(LSP)的属性。
当P(z)的和Q(z)的根是交错并当且仅当根是单调递增的时候,滤波器是稳定的。此外,两个根越近,过滤器在相应的频率谐振越发明显。因为LSP对于噪声的量化并不敏感,稳定性是很容易保证,LSP被广泛用于LPC滤波器量化。线谱频率(LSF)可以进行插值运算。;PLP知觉性线性预测(Perceptual Linear Predictive);PLP分析;注释;LPCC线性预测倒谱系数(Linear Prediction Cepstrum Coefficient);MFCC与PLCC的比较;SBC次频带编码(Sub Band Codec);有设计模型的子带涉及几个问题:
1)定义频率子带,
2)在每个子带使用的数字特征,
3)信息应该在哪些时间单元合并,
4)合并技术。 ;Viterbi Decoder维特比解码器;Viterbi Decoder维特比解码器;DTW动态时间归整法(Dynamic Time Warping );参考模板可表示为
R={R(1),R(2),……,R(m),……,R(M)}
测试模板可表示为
T={T(1),T(2),……,T(n),……,T(N)}
参考模板与测试模板一般采用相同类型的特征矢量(如MFCC,LPC系数)、相同的帧长
1亿VIP精品文档
相关文档
最近下载
- 《你好!法语2》练习册答案.pdf
- QC 715-2004汽车用螺纹连接副摩擦系数的测试方法.pdf
- 2022-2023学年湖南省新高考教学教研联盟高一(下)联考政治试卷(含答案解析).pdf VIP
- 2023年高考地理真题:2023年北京卷高考地理真题.pdf VIP
- 透析中肌肉痉挛课件.ppt
- 第6课 数字作品面面观 课件 三下信息科技浙教版(2023).pptx VIP
- 某大学综合体育馆项目可行性研究报告.doc VIP
- 第6课 数字作品面面观 教案 三下信息科技浙教版(2023).docx VIP
- rcs-978系列220kv说明书变压器成套保护装置.pdf
- 预防医学绪论-预防医学.ppt VIP
文档评论(0)