一种压缩语音识别模板库容量的方法.pdfVIP

下载本文档

2
0
约5.38千字
约 3页
2017-04-18 发布于北京
举报
版权申诉

一种压缩语音识别模板库容量的方法.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

一种压缩语音识别模板库容量的方法.pdf

1 商窗技术 @?@~ i!~@lJ?lfil@O@@W 文章编号 :1002-8684(2006)06叩0046-03 一种压缩语音识别模板库容量的方法 ·论文· 陈育敏，朱杰 (上海交通大学电子信息学院，上海 200240) {摘要]在非特定人孤立词语音识别系统中，模板库的容量成为限制识别植固和性能的重要原因，过大的模板库在成本和实时性方面都不利于语音识别系统的大规模使用。提出了一种用于大幅压缩语音识别模板库容量的方法，适用于非特定人孤立词识别系统。该算法借鉴生态学上各物种对专一环境和普通环境的适应程度上的折衷，通过类似不同生物问争夺食物的演化过程逃出最具代表性的模板组成模板库。模拟结果表明，该算法通过去除近似曾阔的模板以及在某些情况下用一个大模板取代数个模板，能在不显著影响识别率的前提下，明显减少所需模板库的容量。 [关键词]模板库容量;语音识别;优化 (~图分类号] TP391.4 [文献标识码] A A Me伽odωReduce Model-Base Volume for Speech Recognition CHEN Yu-min , ZHU Jie (College of Electrical Engineeri吨， S拙han (Abstract] In the speaker independent isolated words reco伊ition system, the limitation on 出e v刊olull ba自盼e i挝s a s剑ig伊ni凶自c侃an削t factor to hamper the improv附em币衍阳n川l眈t 0佣n rec∞og伊ni凶tion rang萨e and p严erfom呐na朋nc回e. The C08t and compu- tation time that a huge model…ba盼 requirs make it difficult for the recognition system to be used on a large scale. A method is presented to greatly reduce the of model-base volume in speech reco切lition applications for the speaker independent isolated words recognition system. In this method, the most suitable models is selected by us- ing a process similar to different species fighting for food. Simulating results show that by use one general model instead several models in some cases, this algorithm can obviously reduce model-base capability requirement dis唰 tinctívely without significantly affect the reco伊1ìtion rate. (Key words] model-base volume; 8peech-recognition; optimization 1 问题的提出在语音识别的应用中，需要使用大量的训练数据来构成模板库[1，坷。以非特定人小词汇量的语音识别为例，即使只识别单个的数字，但考虑到不同性别、不同地区、不同年龄甚至不同发音习惯(如有人把1读做 yao勺，也要有近百个模板分别用来匹配不同类型的谐音。王理论上讲，模板库的容最越大，能识别出的情况就越多，但模板库过大会导致硬件的成本偏高，且需要大量的处理时间，破坏了实时性，极大地制约了其应用到1罔I鸣。因此，对模板库压缩与沓及其压缩方式，是影响语音识别系统性能的重要因素。由于模板的取舍是离散的，所以要采用具备全局搜索能力的方法，例如基于模拟退火阴或遗传算法的方式I坷。笔者从生物群体进化的角度，提出一种新的搜索方法。阁... 06 2 压缩模板库的思路模板库中由统计而来的大最模板之间还存在着冗余，比如…个模板库要求能识别上梅话和北京话读的数字。-9，常用的做法是为两个地区各自建立一王军模极，对于数字 2，上海读做两，北京读工，的确需要两个不间的模板，但其它的数字两地读法差别不大，共用一个模板就够了。这样，模板数从 20 降到 11 闹不会导致性能显著恶化。又如同一个语音命令某蝶年龄段的语音很