普通话测试中系统神经网络评分机制算法的实现.docVIP

下载本文档

10
0
约4.46千字
约 11页
2018-10-28 发布于重庆
举报
版权申诉

普通话测试中系统神经网络评分机制算法的实现.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

普通话测试中系统神经网络评分机制算法的实现

精选公文范文管理资料 [键入文字] [键入文字] [键入文字] 普通话测试中系统神经网络评分机制算法的实现　　在提升国家普通话水平测试系统评分性能,改进系统评分机制这项研究工作中,语音识别是关键技术,而声学特征的提取与选择是语音识别的一个重要环节.为此,在文献[1]中,笔者提出了一种依据噪声污染情况自适应选取不同策略滤波的算法.首先判断噪声点,然后对轻度噪声污染语音采取梯度法滤波,对中度污染语音采取信号点中值滤波,对重度污染语音采取基于直方图信息的加权均值虑波.该算法在整个噪声率范围内都有效,无需设定参数,自适应能力强.但本文算法针对的是较为理想的干扰噪声模型,其噪声点为0或255,且均匀分布.如果原语音中包含很多取值为0或255的点,该算法将导致语音失真,且不能直接应用于高斯噪声和脉冲噪声点在0到255之间随机取值的语音.此外,笔者在实践中又提出一种噪声检测的有效算法:对噪声点,取所定义的12个梯度值中最小梯度对应邻域音素决定噪声点处的功率值,对信号点保持原值.实验结果表明,噪声率低于0.2,特别是在语音中存在黑、白细线时,新算法在滤除噪声的同时很好地保护了语音细节.但对严重干扰噪声污染语音,该算法中的直线检测存在局限性.在实际测试中,笔者还使用了基于开关滤波思想的算法.首先,采用改进的极值检测法检测语音噪声,建立噪声标记矩阵;然后,根据语音局部噪声污染情况自适应选择不同策略滤除噪声;最后,利用误检音素修正,极大地减少了对信号点的误滤波操作,但是实现应用较为有限. 　　随着语音应用环境的日趋复杂化,特别是在环境噪声和干扰对语音识别有严重影响的情况下,往往会致使语音识别率极大降低,此时滤波算法已经不能满足要求.目前来看,新的普通话测试系统优化主要有如下几方面的问题需要解决:(1).对自然语言的识别和理解.首先必须将连续的讲话分解为词、音素等单位,其次要建立一个理解语义的规则.(2)语音信息量大.语音模式不仅对不同的说话人不同,对同一说话人也是不同的.(3)语音的模糊性.说话者在讲话时,不同的词可能听起来是相似的.这在英语和汉语中常见.(4)单个字母或词、字的语音特性受上下文的影响,以致改变了重音、音调、音量和发音速度等. 　　　　为此,本文探讨在普通话测试中引入系统神经网络评分机制(PSCAI)来有效的解决上述问题,因其所采用的是基于反向传播法(BP算法)的多层感知网络,具有区分复杂的分类边界的能力,十分有助于模式划分. 　　1 PSCAI算法实现　　　　与传统的神经网络不同,普通话测试系统神经网络评分机制PSCAI是一种完全基于神经元连接的网络模型.特别是在评判各地区不同的语音时,网络中的每一个神经元都唯一代表一种语音模式,每当接收新语音模式时,其会自动建立一个新的连接,把信息存储在网络中;而当接收到的是已有的语音模式时,已有的神经元连接得到加强.当模式神经元的输出达到所设定的感觉阈值时,对应模式的信息被记忆.因此,PSCAI能不断地接收、存储各种信息,并把感觉足够强的模式记忆下来,这一过程更接近于人脑的学习、记忆过程.PSCAI在学习新知识时不会影响已有的知识,同时具有很强的识别能力. 　　　　1.1 PSCAI算法引入　　图1(a)是一个3输入2输出的单层感知器.模拟人工测试评分的规律,我们构建了新的PSCAI神经网络,如图1(b)所示.乍看起来,二者并没有什么明显的不同,但事实上存在着本质上的差别.在图1(a)中,利用了编码的概念,即两个输出共有22=4个不同的状态,代表四种语音模式.这样的连接确实可以节省神经元的数量,但却是以增加计算的复杂性为代价的.从网络的工作算法可以看出,输入与输出之间是根据连接权向量形成的一种映射关系,而学习过程实际上就是使输入、输出之间关系从不确定到确定的过程.如果在原有语音知识集中加入新的语音知识,那就要重新选择连接权向量,这样一来,在学习新语音知识的时候可能会影响原有的语音知识,更主要的是,随着语音知识集的扩大,也就是网络规模的增加,每次学习新语音知识所进行的运算量会越来越大.而人工测试评分的规律是,已有的、与新知识相关的知识越丰富,学习、记忆新知识就越快、越容易,而与新知识毫不相关的内容则不受任何影响.【图1】　　1.2 PSCAI神经元之间的连接规则　　以图1(b)为例,每当第一次接收到某个模式xj=(x1,x2,x3)∈{0,1}3×1,就会有一个神经元j把所有处于兴奋状态的输入层神经元连接起来,例如,神经元1、2、3分别对应的输入为(1,1,0),(1,0,1),(1,1,1).神经元j的输出可以表示为:【1】　　　　通过这种连接规则,yj就是输入语音模式xi的响应,其大小