- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2012年 第2l卷 第 5期 http://www.c-s-a.org.cn 计 算 机 系 统 应 用
基于PCA和 LDA的方言辨识①
何 艳,于风芹
(江南大学 物联网工程学院,无锡 214122)
摘 要:针对PCA没有有效利用样本的类别信息而导致方言识别率低的问题,采用PCA和LDA组合方法进行
特征提取。首先用PCA对普通话、上海话、广东话和闽南话四种方言进行降维,然后在降维后的空间中用LDA
进一步特征提取,最后将该特征向量送入 BP神经网络进行辨识。仿真实验结果表明,基于PCA和 LDA的方言
识别的平均识别率高达85%。
关键词:方言辨识:主成分分析;线性鉴别分析:BP神经网络
DialectIdentificationBasedonPCAandLDA
HEYah,YUFeng-Qin
(SchoolofInteractofThingsEngineering,JiangnanUniversity,Wuxi214122,China)
Abstract:Inorderto solvethe low dialectidentificationratebecausePCA doesn’teffectively usehtesample
classificationinformation,amethodoffeatureextractionusingPCAandLDAisemployed.Inthispaper,PCAisusedto
effectivelyreducehtedimensionsofMandarin,Shanghainese,Cantonese,M innanese,nadhtenLDA isadoptedto
extractfeaturevcetorsfrom htedmiension-rdeucde spaceaShteinputvectorswiht BPneuralnetworktorecognize.The
SimulationresultsdemonstratehtathteaveragedialectidentificationratebaSedonPCA andLDACna beupto85%.
Keywords:dialectidentification;PCA;LDA;BPneuralnetwork
方言识别在公安刑侦工作和语音识别技术的推广 从高维特征空间提取出具有辨别力的低维特征。文献
和应用中有着重要意义,已越来越受到相关领域研究 4【】采用 LDA特征提取方法在中文大词汇量连续语音
人员的重视。在方言辨识中,提取语音信号的特征至 识别系统中音节识别率达到 82.16%。文献 5【】证明了
关重要。主成分分析法 (PrincipalComponentAnalysis, LDA不仅可以应用在 PCA 降维后的空间中,并且通
PCA)是 目前常用的特征提取方法 ,此变换可以达到 过PCA降维可以使LDA散布矩阵的维数进一步减小,
降维的目的,且降维后能保存样本的主要信 ”。PCA 从而在一定程度上避免LDA的小样本问题,提高LDA
广泛应用与语音识别中,文献 2【】将语音信号分割为子 算法的可用性。
词后,对各子词单元 内各帧语音的特征矢量进行PCA, 因此,本文提出了PCA和 LDA相结合的特征提
且用DTW进行语音识别,识别率为90%左右 。 取方法,首先对普通话、上海话、广东话和闽南话四
PCA由于没有有效利用样本的类别信息,所以用 种方言的语音信号用 PCA方法进行有效的降维,然后
PCA算法得到的特征并不是最有辨别力的特征。线性 为了提取具有辨别力的低维特征,在降维后的空间中
鉴别分析 (LinearDiscriminantAnalysis,LDA)也是 继续用 LDA 进行特征提取,最后将该特征向量作为
通过求取一个变换矩阵再做线性转换来达到降维的 目 BP神经网络的输入来进行辨识。仿真实验结果表明,
的,但与 PCA不同的是,LDA使模式样本 内的分布 基于PCA和 LDA组合的识别率为85%,PCA方法的
凝聚而使样本间的分布疏远3【1。LDA算法的目
文档评论(0)