1. 1、本文档共40页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
声音探伤

运用呼吸系统发出的声音决定呼吸系统状况的方法与装置 专利介绍 装置构成 1、格式化该声音的数字信号为至少一个区块的装置; 2、从该声音的格式化的数字信号来计算一参数的装置; 3、利用隐藏马氏链来计算该参考模块的装置; 4、以计算在该参数与参考模块之间的相似度,来比较该参数与该代表呼吸系统已知状况的参考模块的装置; 5利用该参数与该参考模块间的相似度,决定该参数是否与该参考模块一致,并做出正确选择的模块。 详细步骤 1、接收表示呼吸系统声音的声音信号 2、将该声音信号转换为数字信号 2.1、格式化该数字信号为至少一个区块,该区块由大概25毫秒的数字数据与大概10毫秒的重叠数据所组成 3、从该声音的格式化的数字信号来计算该参数 3.1、从该数字信号计算MFCC系数 3.1.1、使用一FFT转换 3.2、计算约39个参数 4、利用一维ViterbiDecoder来计算该参数与参考模块间的相似度 5、提供一个该呼吸系统的已知状况为输出 6、利用HMM来计算该参考模块 7、储存与该呼吸系统已知状况相对应的参考模块于一储存装置中 诊 断 疾 病 明 细 输入与AD转换 输入包括 一个麦克风 AD转换模块接收该模拟声音信号,对该接收到的模拟声音信号进行取样,并且将该模拟声音信号转换为数字信号。 在一个示范的实例中,该AD模块以大约每秒16000个取样的取样率对模拟声音信号进行了20秒的取样。产生了一组足够铸出正确分析的数字信号 。然而,品质差的模拟声音信号可能需要更多的数字信号。 对于该数字信号进行了处理,即将该数字信号切割成一连串的区块,每一个区块期间为25ms,在连串区块间插有10ms的重叠数据以提供流畅的数据形态。 求取声音数字信号参数MFCC (Mel-Frequency Cepstrum Coefficient) MFCC:Mel频率倒谱系数。 Mel频率是基于人耳听觉特性提出来的,它与Hz频率成非线性对应关系。Mel频率倒谱系数(MFCC)则是利用它们之间的这种关系,计算得到的Hz频谱特征。 功率谱的对数值的逆傅氏变换称为倒谱 计算与参考模块的相似度 Viterbi Decoder Viterbi算法是一种最大似然译码算法。 Viterbi算法的基本思路是:以断续的接收码流为基础,逐个计算它与其他所有可能出现的、连续的格状图路径的距离,选出其中可能性(概率)最大的一条作为译码估值输出. 计算、学习、训练参考模块 HMM (Hidden Markov Model) 隐马尔可夫模型是一个二重马尔可夫随机过程,包括具有状态转移概率的马尔可夫链和输出观测值的一般随机过程,其状态只有通过观测序列的随机过程才能表现出来。 一个HMM 包含两层:一个可观察层和一个隐藏层。 得出诊断结果 语音特征提取 特征提取 就是指从说话人的语音信号中获得一组能够描述语音信号特征参数的过程。 通过不断的实验和探索,人们发现语音信号是声道频率特性和激励信号源两者的共同结果,后者对于某一信号来说常带有一定的随机性,而说话人的个性特征在很大程度上取决于说话人的发音声. 因此,音特征参数可以是能量、共振峰值、基音频率等语音参数.目前,在语音识别中较为常用的特征参数为MEL倒谱系数MFCC与线性预测倒谱系数LPCC,两者都是将语音从时域变换到倒谱域上 ,前者构造人的听觉模型,以语音通过滤波器组的输出为声学特征,直接通过离散傅立叶变换(DFT)进行变换;后者从人的发声模型角度出发,利用线性预测编码(LPC)技术求倒谱系数 MFCC的分析符合人类的听觉特性,人耳具有一些特殊的功能,能在嘈杂的环境中以及各种异变情况下分辨出各种语音,其中耳蜗起了关键作用 . 耳蜗实质上就相当于是一个滤波器组,耳蜗滤波作用是在对数频率尺度上进行的,1 000 Hz以下是线性尺度,1 000 Hz以上是对数尺度,这就使人耳对高频敏感.根据这一原则研究了一组类似于人耳蜗作用的滤波器即Mel频率滤波器. MFCC是使用傅立叶分析提取的语音特征参数,是类似于指数的形式,它和实际频域之间的关系见下式. [1] [2] 式中,Fmel是以MEL为单位的感知频域 ,FHz是以Hz为单位的实际频域.将语音信号的频谱变换到感知频域中,能更好地进行模拟听觉过程的处理. ----《MFCC和LPCC特

文档评论(0)

f8r9t5c + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8000054077000003

1亿VIP精品文档

相关文档