- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
普通话测试中系统神经网络评分机制算法的实现
精选公文范文管理资料
[键入文字] [键入文字] [键入文字]
普通话测试中系统神经网络评分机制算法的实现
在提升国家普通话水平测试系统评分性能,改进系统评分机制这项研究工作中,语音识别是关键技术,而声学特征的提取与选择是语音识别的一个重要环节.为此,在文献[1]中,笔者提出了一种依据噪声污染情况自适应选取不同策略滤波的算法.首先判断噪声点,然后对轻度噪声污染语音采取梯度法滤波,对中度污染语音采取信号点中值滤波,对重度污染语音采取基于直方图信息的加权均值虑波.该算法在整个噪声率范围内都有效,无需设定参数,自适应能力强.但本文算法针对的是较为理想的干扰噪声模型,其噪声点为0或255,且均匀分布.如果原语音中包含很多取值为0或255的点,该算法将导致语音失真,且不能直接应用于高斯噪声和脉冲噪声点在0到255之间随机取值的语音.此外,笔者在实践中又提出一种噪声检测的有效算法:对噪声点,取所定义的12个梯度值中最小梯度对应邻域音素决定噪声点处的功率值,对信号点保持原值.实验结果表明,噪声率低于0.2,特别是在语音中存在黑、白细线时,新算法在滤除噪声的同时很好地保护了语音细节.但对严重干扰噪声污染语音,该算法中的直线检测存在局限性.在实际测试中,笔者还使用了基于开关滤波思想的算法.首先,采用改进的极值检测法检测语音噪声,建立噪声标记矩阵;然后,根据语音局部噪声污染情况自适应选择不同策略滤除噪声;最后,利用误检音素修正,极大地减少了对信号点的误滤波操作,但是实现应用较为有限.
随着语音应用环境的日趋复杂化,特别是在环境噪声和干扰对语音识别有严重影响的情况下,往往会致使语音识别率极大降低,此时滤波算法已经不能满足要求.目前来看,新的普通话测试系统优化主要有如下几方面的问题需要解决:(1).对自然语言的识别和理解.首先必须将连续的讲话分解为词、音素等单位,其次要建立一个理解语义的规则.(2)语音信息量大.语音模式不仅对不同的说话人不同,对同一说话人也是不同的.(3)语音的模糊性.说话者在讲话时,不同的词可能听起来是相似的.这在英语和汉语中常见.(4)单个字母或词、字的语音特性受上下文的影响,以致改变了重音、音调、音量和发音速度等.
为此,本文探讨在普通话测试中引入系统神经网络评分机制(PSCAI)来有效的解决上述问题,因其所采用的是基于反向传播法(BP算法)的多层感知网络,具有区分复杂的分类边界的能力,十分有助于模式划分.
1 PSCAI算法实现
与传统的神经网络不同,普通话测试系统神经网络评分机制PSCAI是一种完全基于神经元连接的网络模型.特别是在评判各地区不同的语音时,网络中的每一个神经元都唯一代表一种语音模式,每当接收新语音模式时,其会自动建立一个新的连接,把信息存储在网络中;而当接收到的是已有的语音模式时,已有的神经元连接得到加强.当模式神经元的输出达到所设定的感觉阈值时,对应模式的信息被记忆.因此,PSCAI能不断地接收、存储各种信息,并把感觉足够强的模式记忆下来,这一过程更接近于人脑的学习、记忆过程.PSCAI在学习新知识时不会影响已有的知识,同时具有很强的识别能力.
1.1 PSCAI算法引入
图1(a)是一个3输入2输出的单层感知器.模拟人工测试评分的规律,我们构建了新的PSCAI神经网络,如图1(b)所示.乍看起来,二者并没有什么明显的不同,但事实上存在着本质上的差别.在图1(a)中,利用了编码的概念,即两个输出共有22=4个不同的状态,代表四种语音模式.这样的连接确实可以节省神经元的数量,但却是以增加计算的复杂性为代价的.从网络的工作算法可以看出,输入与输出之间是根据连接权向量形成的一种映射关系,而学习过程实际上就是使输入、输出之间关系从不确定到确定的过程.如果在原有语音知识集中加入新的语音知识,那就要重新选择连接权向量,这样一来,在学习新语音知识的时候可能会影响原有的语音知识,更主要的是,随着语音知识集的扩大,也就是网络规模的增加,每次学习新语音知识所进行的运算量会越来越大.而人工测试评分的规律是,已有的、与新知识相关的知识越丰富,学习、记忆新知识就越快、越容易,而与新知识毫不相关的内容则不受任何影响.【图1】
1.2 PSCAI神经元之间的连接规则
以图1(b)为例,每当第一次接收到某个模式xj=(x1,x2,x3)∈{0,1}3×1,就会有一个神经元j把所有处于兴奋状态的输入层神经元连接起来,例如,神经元1、2、3分别对应的输入为(1,1,0),(1,0,1),(1,1,1).神经元j的输出可以表示为:【1】
通过这种连接规则,yj就是输入语音模式xi的响应,其大小
您可能关注的文档
- 日本高等教育改革动态 按 日本的高等教育体制和欧美有明显不同 .doc
- 日本钢板表面处理技术基础研究的进步和展望.doc
- 日照市建设工程监理招标文件范本 工程.doc
- 日用消防水泵房设备水池配管及配电控制安装工程监理.doc
- 日用玻璃行业准入条件 为加快推进日用玻璃行业结构调整和产业升级,防止盲目投资和低水平重复建设,加强节能减排,保护生态环境,提高资源综合利用效率.doc
- 日用消防水泵房设备水池配管及配电控制安装工程监理细则.doc
- 日立电梯实习报告.doc
- 日用长石质瓷坯料配方设计.doc.doc
- 日语中男女用语差异的形成与趋势初析.doc
- 日语精读课论文教学优化论文高职日语精读课程的教学过程优化浅析.doc
最近下载
- Unit 4 Helping in the community Part B Read and write课件2025-2026学年度人教PEP英语四年级上册.pptx VIP
- 恶性肿瘤合并急性脏器功能不全患者预后的多维度解析与临床策略研究.docx
- 综合实践活动课程教学设计.pptx
- 02S404 防水套管国标规范.pdf VIP
- 云南省爱我国防知识网络竞赛活动初中组题库及答案.pdf VIP
- 桂林电子科技大学《高等数学》2020-2021学年第二学期期末试卷及答案.pdf VIP
- 义务教育版(2024)五年级 信息科技 《第3课 游戏体验寻规律》教学设计.docx VIP
- 《(湖北省)事业单位聘用合同范本-(以纸本为准)》.doc VIP
- 人教版九年级化学总复习计划..doc VIP
- FreeCAD中文教程-翻译版本_freecad【181页】中文教程.pdf VIP
文档评论(0)