- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
病态嗓音特征的神经网络选择
于燕平 胡维平
摘要:病态嗓音自动检测和评价的关键是有效提取相关的特征,但一般的提取原则是尽可能的把相关特征纳入特征集,其结果就很难避免各种特征的相关和冗余信息,并对随后的识别效率和检测带来负面影响,因此特征优选工作就显得非常重要。本研究对待识别嗓音样本分别提取出两种特征参数(传统声学参数和基于小波变换提出的特征参数)后,利用神经网络分别对这两种特征参数进行了特征选择和优化,并分别对选出的各组特征进行了识别,结果表明基于神经网络的特征选择方法是有效的,从基于小波变换提出的特征中选出的7维特征矢量完全能取代原始特征矢量,并取得了正常95.06%,病态92.85%的识别结果。
关键词:病态嗓音;神经网络;显著性度量;高斯混合模型;
引言
嗓音的产生是一个复杂的生理、物理过程,由于各种原因造成的嗓音疾病阻碍了人们正常的社会交往和信息交流。如何保留 和提高喉发音功能及其检测方法成为了众多信号处理及统计模式识别领域研究者关注的焦点[1]。
建立在声学参数分析基础上的病态嗓音检测与评价始终无法摆脱医生的主观判断。随着计算机技术及统计模式识别的迅猛发展,建立在模型统计基础上的病态嗓音自动检测也迅速成为了研究热点,经过几十年的发展,形成了众多的研究方法[2]。但无论以何种方式提取出的参数总是尽可能的把所有特征纳入特征矢量集,这样就难以避免冗余,使得建立的模型变得复杂,并因某些特征加入而导致识别性能降低。而要使病态嗓音识别应用于临床,我们希望得到的是一组既简单又容易实现的特征。因此对提取出的病态嗓音特征作进一步的优化,选出有效的特征将对病态嗓音的自动检测具有重要的意义。
传统穷举法特征选择方法,由于较多的特征将产生大量的组合,大大的增加了计算量。人工神经网络具有很强的聚类能力和静态分类能力,被广泛用于特征提取、选择和各种分类判决[3]。文中分别用传统声学参数方法与基于小波变换方法提取出病态嗓音特征,利用神经网络对提出的特征进行了特征选择,并对比分析了特征选择前后对病态嗓音的识别性能。
1 数据来源
实验数据来源于临床病例,采集数据时的环境要求在安静的室内进行;采样频率为16 kHz,量化精度16 bit,时间1.5~3 s;受试声样为元音[a][4],分别对正常人和患有各类喉科疾病的对象进行语音采样。正常对照组242例,年龄18~40周岁,平均年龄25周岁,近期无喉部疾病者;病态嗓音组年龄15~50周岁,平均年龄27周岁,为前来医院就诊临床病例。实验时,将数据库的242例正常嗓音和234例病态嗓音任意分割成两部分,其中取正常嗓音和病态嗓音各80例(近似1/3样本数)作为模型训练集;其余部分作为测试集,分别为162例正常嗓音和154例病态嗓音[5]。
2 基于神经网络特征选择的原理
神经网络模型选择单隐含层前馈网络如图1所示。
图1 单隐含层前馈网络结构图
Fig.1 The chart of the single-layer neural network of feed-forward
如果有足够的隐层节点,一个单隐含层的网络就足以逼近任意的网络[6],这种网络算法分为两个过程:模式从输入层通过隐含层逐层向输出层传播,误差从输出层经隐含层逐层向后传播。隐层和输出层激活函数使用sigmoid函数,如式(1) (1)
特征提取的目的就是要找到那些对网络有贡献的特征,当设计一个分类器的时输入的特征可能既包含了大量有用的特征同时也包含了大量无用的信息,为了得到最佳的特征,方法有穷举算法。但当输入的变量比较多的时候,穷举法就变得不实用了。Ruck[7]提出的给特征分级的矩阵叫做特征显著性度量。
首先计算度量方程输出与某个具体输入的导数,当网络使用的激活函数为sigmoid函数时,公式如下:
(2)
这里是输出层第个节点的输出,是隐含层到输出层的连接权值,为输入层到隐含层的连接权值,,其中是第一层节点的输出。从上面的方程可以看出它的导数依赖于网络的输入以及网络内部的权值。
最后,第个输入特征显著性度量可以定义为:
(3)
这里是训练样本集,为训练矢量的数目,为第类输出,为网络权值,表示输入的定义域。以此为基础的特征重要性判决准则是:如果,则第个特征比第个特征更重要。
文献[8]提出一种更简单的方法来选择出有意义的输入特征,第个输入特征的显著性度量方程:
(4)
为了更好的理解这两种度量方程的关系,我们有必要看Ruck显著性度量方程的简单形式:
(5)
其中为一系列的训练矢量,输出节点。
基于这种平均度量方程的方法要经过多次的训练来完成。我们想要找到一种方法能够比
文档评论(0)