一种基于MFCC和LPCC的文本相关说话人识别方法.pdfVIP

下载本文档

8
0
约1.07万字
约 3页
2015-07-23 发布于重庆
举报
版权申诉

一种基于MFCC和LPCC的文本相关说话人识别方法.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

一种基于MFCC和LPCC的文本相关说话人识别方法.pdf

维普资讯第26卷第4期计算机应用 Vo1．26No．4 2006年4月 ComputerApplications Apr．2006 文章编号：1001—9081(2006)04—0883—03 一种基于MFCC和LPCC的文本相关说话人识别方法于明，袁玉倩，董浩，王哲 (河北工业大学信息工程学院，天津300130) (yuming@hebut．edu．cn) 摘要：在说话人识别的建模过程中，为传统矢量量化模型的码字增加了方差分量，形成了一种新的连续码字分布的矢量量化模型。同时采用美尔倒谱系数及其差分和线性预测倒谱系数及其差分相结合作为识别的特征参数，来进行与文本有关的说话人识别。通过与动态时间规整算法和传统的矢量量化方法进行比较表明，在系统响应时间并未明显增加的基础上，该模型识别率有一定提高。关键词：说话人识别；线性预测倒谱系数；美尔倒谱系数；矢量量化；动态时间规整中图分类号：TP18；TP391．42 文献标识码：A Text-dependentspeakerrecognitionmethodusingMFCC andLPCC features YU Ming，YUAN Yu．qian，DONG Hao，WANGZhe (SchoolofInformationEngineering,HebeiUniversityofTechnology,Tianfin300130，China) Abstract：Intheprocessoffeatureextractionofatext-dependentspeakerrecognition system，thedifferenceofMel FrequencyCepstrumCoefficient(MFCC)andLinearPredictionCepstmmCoefficient(LPCC)waschosentobethespeech characteristicparameters，andintheprocessofspeechmodeling，avariancewa$addedtothecodewordofVectorQantization (VQ)andgotcontinuousvectorquantization，thencompareditwithDynamicTimeWarping(DTW)methodandvqmethod in text-dependentspeakerrecognitionexperiment．Theresultsofidentification show thattherecongitionefficiency isproved withoutanyobviousincreasingofrespondstime． Keywords：speakerrecognition；LinearPredictionCepstmmCoefficient(LPCC)；MelFrequencyCepstrum Coefficient (MFCC)；VectorQantization(VQ)；DynmaicTimeWapring(DTW) VectorQantization，CVQ)模型，从而，码本的码字由一对矢量 0 弓l言来表达，能够更好的反映特征分布的离散程度。经过实验证说话人识别是语音识别的一个分支，它和语音识别一样，实，在系统响应时间并未明显增加的基础上，这种连续码字分都是