在人工耳蜗中对频谱信息进行有效的语音处理(渣翻译).docVIP

下载本文档

4
0
约 6页
2017-01-27 发布于重庆
举报
版权申诉

在人工耳蜗中对频谱信息进行有效的语音处理(渣翻译).doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

在人工耳蜗中对频谱信息进行有效的语音处理(渣翻译)

利用频谱信息的人工耳蜗语音处理作者，作者*（小四号楷体，居中，拟作报告者在作者名下添加下划线）（学校专业，邮编，通讯作者邮箱）（5号宋体/Times New Roman，居中）摘要基于对普通话的声学研究成果，利用频谱信息的人工耳蜗语音处理的两种新的算法在声学仿真实验得到有效的认证。我们提出的新算法传送基于所述频带的选择的频谱信息。这些新的算法不仅可以提高在嘈杂的环境中人工耳蜗植入者的语音识别能力，同时也降低了复杂度的计算和所占用的内存，并使其更适合于临床治疗。关键词人工耳蜗，语音信号处理，信号处理人工耳蜗植入（简称助听器）是唯一可以通过提取编码振幅调制一个固定频率的电刺激脉冲时域语音信号的包络，以恢复听力的能力，帮助完全失聪人士的可用医疗设备。在中国160余人成功地恢复了自己的听觉通过助听器。虽然现代的助听器能够在安静的环境中识别识75％左右的语句，但是大多数的助听器用户在嘈杂环境中识别语言的能力还相当差，尤其是在普通话的语音识别方面，因为即使是一个单音节的色调是也可能是一个有意义的词汇。许多研究者致力于开发新的语音处理算法，它不仅可以传送时间包络信息，而且传送的频谱信息，以提高助听器用户的语音识别能力。 Chen等人与仁王克拉??人。从听力正常的受试者的声音信号中导出了调幅（AM ）和调频（FM ）信息，并进行了声学仿真实验，。他们发现，调频额外的编码可以显著提高噪声英语语音识别。伊恩·克拉人。通过提取和编码的窄带信号的手两个信封和语音信号的基本频率（F0 ）开发了一种新颖的算法。 F0是用于调制的正弦波的中心频率在声学模拟实验。该算法可以显著改善对汉语的识别。所有这些研究??证明了频谱信息可以显著提高言语感知的助听器用户的能力。而根据语音学研究，我们假设每个通道中传输信息时三个方面都会有冗余信息。更紧凑的算法可以减少输送频谱信息的冗余信息。首先，输送普通话色调信息的管道有冗余。时域包络信息和频谱信息有助于在语音信号处理中息识别普通话的4个声调。许多研究中分离出的频谱信息和时域包络信息显示，比如元音持续时间和幅度轮廓有助于普通话声调识别。这方面的作用，有时很显著，但是在多个管道传送音调信息时由基本频率及其谐波引起的频谱间距时作用相对较弱。即使有些管道中可以得到分离完美的铃声识别，所以输送普通话的声调信息的管道有冗余。其次，完美的声调识别可以通过只提取和编码速度类和频谱信息的范围在低频率相实现。以前的研究发现，直接获取识别完美的音色的基本频率和低通在300赫兹的间接由残余沥青的谐波结构，可以由低频率滤波实现。因此，在低频段输送的时域和频谱的信息有可能足以获得完美的语音识别。最后，传统的频谱算法在高频段不能感知声音。许多研究人员专注于如何提取频谱的信息来提高语音识别能力。两种类型的频谱信息，如F0和FM语音信号的每个频带编码信号。但在高频段，F0和FM采用了助听器用户无法感知的频谱信息的传统算法的编码算法。因为无论是在低频或高频波段，光谱信息，而在低的频率范围约100赫兹，是用来调节中心频率的正弦波声模拟实验。因此，在高频波段，频谱中形成的变化范围相对于正弦波对应于这些频带的中心频率（例如，光谱信息对中心频率比8通道人工耳蜗植入正弦波从最低到最高频带如下：47.4%，28.4%，17.5%，11.1%，7%，4.5%，3.96% 1.9%）是微不足道。这使得在高频段使用传统算法编码后助听器用户很难识别。基于这三个方面的研究，我们认为完美的语音识别可以实现，我们在较低的频率编码的时域包络和频谱信息中提取，但只有在较高的频带编码的时域包络。这使得频带的选择中的频谱信息提取和编码为频率调制在低频部分的原理（靠近耳蜗的顶点），频谱信息计算或使用在高频部分防暴（基地附近）的数目与频谱信息的频率范围从顶点（定义为参数S）是德测定的声学模拟实验结果实验。我们提取和编码的频谱信息有两种方式，即选择性的基本频率控制（ SFFC ）算法和选择性频率振幅调制编码（ SFAME ）算法。通过不同的语音材料在不同环境中来证明在声学仿真实验算法的有效性。在这项研究中进行的声学仿真实验扩展了调频，形成在白噪声和混合环境下的语音识别普通话贝丝效果的研究，并且扩大了在F0的在多信噪比白噪声环境中，在多TMR混合的语音环境下的研究。类似的结果已经从使用不同的频谱信息得到与传统算法相比连续交替取样。它还表明使用频谱信息提高人工耳蜗植入者的语音识别能力的巨大潜力。 1. 算法存在于所有主要的临床人工耳蜗产品CIS算法。输入的语音信号首先被1.2 kHz于6分贝/月，然后被分离为几个频带（4，6 ，8，12等）通过的带通滤波器组。低频率的频带对应于耳蜗的顶部，而高频段对应于刺激耳蜗的底电极上的电极。在每个频带的包络信号可以整流器和低