- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中国传媒大学 2011-2012 学年第3学期
数字语咅技术 课程
题 目基于神经网络的语音识别研究
学生姓名 秦越
学 号 200910013126
班 级 电子信息工程3班
学生所属学院信息工程学院
任课教师戴志强
教师所属学院信息工程学院
成 绩
摘要:本文主要提出了一种基于双权值神经网络的非特定人连续语音 识别的新算法。这种算法可以不经过端点检测和分割,构建连续语音 中各不同音节的特征空间覆盖区,可以避免因分割错误而带来的错 误识别。
关键词:双权值神经网络 连续语音 语音识别
概述
语音是人类交流和交换信息中最便捷的工具和最重耍的媒体。语 音识别技术是集声学、语音学、语言学、计算机、信息处理和人 工智能等诸领域的一项综合技术,应用需求十分广阔,在近半个多世纪 以来一直是人们研究的热点。
语音识别系统可以依照语音识别的单元及语音识别系统是否依 赖特定人而分成以下四类:
特定人,孤立词语音识别;
非特定人,孤立词语音识别;
特定人,连续语音识别;
非特定人,连续语音识别。
可以看出,这四类系统的难度是依次增加的。在语音识别系统的 性能中,语音识别的正确率以及字表大小和内容是主要的,此外还有系 统对发音的要求高低、系统的抗噪声能力、训练量的大小等等。目 前常用的语音识别算法有动态时间规整法(DTW)、隐马尔可夫模型 (HMM)和人工神经网络(ANN)等,其中基于统计的HMM算法可能是 目前最为成功的一种语音识别模型和算法了。然而,HMM语音识别模 型也存在一些严重的缺陷,如:鲁棒性不够理想,抗噪音的能力比较弱 以及需要大量的训练样本等等。另外,由于连续语音识别技术存在单 词切分困难的特点,而单词切分错误又直接影响到语音识别的识别 率。基于以上连续语音识别技术的难点,本文从双权值神经网络的结 构出发,提出了一种基于双权值神经网络的非特定人连续语音识别的 新算法。这种算法可以不经过端点检测和分割,构建连续语音中各不 同音节的特征空间覆盖区,得到了较为满意的识别结果
双权值神经网络的结构
双权值神经元模型的结构图如图1所示。双权值神经元的典型 的特点就是它不仅有相当于前馈网络中的方向权值W,而且还有相 对于RBF径向基函数网络屮的核心权值Zo这样的双权值神经元是
一个具有良好的局部反应性质、各向异性的高阶神经元。
图1双权值神经元模型
双权值神经元的基本算式为:y=\fx[ Wj(XL-w^] iw’Xj-眄)卩-① 丿令I叫(X厂叫)1丿7 J J
其中Y为神经元的输出,f为神经元激励函数,0为神经元的阈值,Wj 为由第j个输入端接至神经元的方向权值,W;为由第j个输入端接 至神经元的核心权值,Xj为第j个输入端(正值),M为输入空间维数, S为决定单项正负号方法的参数,S = 0时单项符号永为正,S =1时单
项的符号与Wj的符号相同,P为幕参数。
这种网络模型是一种通用的神经元网络模型,传统的通用前馈 网络和径向基函数(RBF)网络都是它的一种特例。如果核心权值M 全为0, S = l,p = 1,则2?12式就是一个经典的神经元数学模型;如果 核心权值附全为1, S二0, p二2,则y是一个径向基函数(RBF)网络
的神经元。
构造双权值神经网络的学习算法
步骤1:设某类问候语单字所有的样本点集合为Q二{人,
A…,Av },N为样本点总数。计算出这些点两两之间的距离,找到 距离最小的两个点,记为色、禺,计算其它点到这两点的距离和,将 距离和最小,且与叭、弘不共线的点记作环点,这样构成第一个平面
三角形目百2弘,记作G ,用一个双权值神经元来覆盖,其覆盖范围为:
XI% 5Th,X WR”
^={yiy = a2[a1BI1+(l-a1)B12] + (l-a2)B13,tz1€[O,l],a2G[O,l]} 其中铁。表示点X到空间q的距离。
步骤2:对于前一个己构造好的几何形体P1 ,判断剩余点是否被 该形体包含,若在形体覆盖范围内,则排除该点。对于在形体之外的样 本点,按照第1步的方法,找出离目百2弘三点距离和最小的点弘,将 BnB12B13三点中离弘最近的两个点记作场2场3 ,场2与 构成第二个平 面三角形,记作0 , B、\B詞3三点中离场]最近的两个点记作%场3 , B22场3与场]构成第二个平面三角形场血%,记作g ,同样用一个双权 值神经元来覆盖,其覆盖范围为:
其中Q泮表示P2=[X\px(
其中Q泮表示
02={Y\Y = a1[axB2X +(l-^)522] + (1-cz2)B23,cZj e[O,l],cz2 e[O,l]j
点X到空间0的距离。
步骤3:在剩余点中排除包含在前面(i?1)个双权值神经元覆盖 体积内的样本点,在覆盖体积外的样本点中,找出离前面第i -1个 三角形的顶点的距离
文档评论(0)