- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种时间规整算法在神经网络语音识别中的应用-东南大学学报
第 卷第 期
29 5 东 南 大 学 学 报 Vol29No5
年 月
1999 9 JOURNALOFSOUTHEASTUNIVERSITY Sept.1999
一种时间规整算法在神经网络语音识别中的应用
史笑兴 顾明亮 王太君 何振亚
(东南大学无线电工程系,南京 210096)
摘 要 提出一种新的网络结构,这种网络能够很好地解决神经网络语音识别中的
时间规整问题 该网络从输入语音信号的特征矢量序列中提取一组固定数目的特征
.
矢量,然后将这组特征矢量馈入神经网络分类器进行识别 和其他的神经网络语音识
.
别方法相比较,用这种网络进行前端处理,可以缩短后端神经网络分类器的训练和识
别时间,简化分类器的网络结构并保持较高的识别率.
关键词 时间规整算法;神经网络;语音识别
分类号 TN91234
神经网络具有很强的分类能力,它能解决模式分布非常复杂的分类问题,是进行语音识别
的有效方法 但对神经网络语音识别而言,存在着时间规整这一难以解决的问题 由于输入语
. .
音信号的长度是可变的,而大多数神经网络分类器的结构是固定的,这就意味着必须设法从可
变长度的输入语音信号中提取相同维数的特征矢量 一种可行的方法是建立一个混合模型,在
.
这个模型中,前端完成时间规整功能,将输入语音信号的特征矢量处理成相同维数,后端是神
[,]
12
经网络分类器,完成分类识别 在过去的几年中,人们提出了一些时间规整算法 ,在这些算
.
[]
1
法中,广义最小失真分段算法( ) 是一种很好的方法,实际上, 是最小失真分段算
GMDS GMDS
法( )的推广 在 中,一个语音段用段内各帧语音的特征矢量的加权平均来表示,而在
MDS . MDS
中,一个语音段则是用一组描述该段语音特征矢量的平滑二阶曲线来表示 另一个简单
GMDS .
而有效的方法是特征参数曲线方法( ),该方法包含 个子方法,其中表征点序列法( )
FPCM 3 RPS
是一个很有创意的方法,我们将该方法结合进本文提出的语音识别系统中.
1 前端时间规整类网络的原理、结构和算法
语音信号具有很强的随机性,即使是同一个人在不同时刻的同一句话发的同一个音,也不
可能具有完全相同的时间长度 不同的发音习惯,发音时所处的环境不同,心情不同都会导致
.
这种发音持续时间长短不一的现象 因此在进行语音识别时,有必要首先对语音信号进行时间
.
规整 根据以前的研究,可以确定:一次正确的发音应该包含构成该发音的全部音素以及
您可能关注的文档
- R迪正福州工程检测有限公司.DOC
- RevisedGuidelines20007-17-社会福利署.DOC
- RG系列滚柱型线性滑轨.PDF
- SAP术语A—ABCClassification--ABC分类法对于库存的所有物料按照.DOC
- RS232串口协议详解-在路上.PDF
- SDGP2017-017项目说明-山东政府集中采购网.DOC
- SDGP201510A1包货物明细表-山东政府集中采购网.DOC
- SCR092双通道硅单向可控硅.PDF
- SFCM模糊聚类在语音矢量量化中的应用-JournalofNortheastern.PDF
- SH3012003石油化工企业给水排水系统设计规范pdf.PDF
文档评论(0)