语音信号与文本信息的智能处理供参习.docVIP

下载本文档

2
0
约 10页
2017-02-10 发布于江苏
举报
版权申诉

语音信号与文本信息的智能处理供参习.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

语音信号与文本信息的智能处理供参习

语音信号与文本信息的智能处理第一章概述处于信息革命浪潮时代的今天，人们对于各种各样信息的需求与日俱增，同时人们急切需要更好的信息处理方式。语音，作为人类信息交流的最自然、最有效、最灵活而又最为广泛使用的途径，越来越引起研究者的关注。文本信息，具备易于传播，所需存储空间小等特点，也是人们日常生活中最经常使用的交流方式之一。对语音信号，文本信息的智能处理，正是为了更好地满足人们日益增长的信息需求。智能处理是指能模仿人的智能(归纳，抽象，形式推理、联想和自适应等) 的处理.智能(Intelligence)一词源于“Legere。意思是收集、汇集，它通常指人类的脑力劳动，包括感知、学习、推理和判断等;有人把它定义成是随外界尖化的一种正确的反应能力。人的智能现在己能让电脑机器模仿的主要是学习、推理、联想、判断与自适应的智能。本文着重研究了语音信号与文本信息的智能处理。虽然文本信息和语音信号表面上看起来没有直接的联系，但是对两者的处理方法却有很大的相似之处。因为无论是文本相似判别中使用的特征矢量判别比较，或者是端点检测中利用的判断方法，实际上都是在某一个特定的空间中比较两个矢量的某种距离。说到底，两种处理手段都是一致的。 1.1中文信息处理研究的历史与现状概括地说，中文信息处理可分为字处理平台、词处理平台和句处理平台这3 个层次。字处理平台的研究与开发，包括汉字编码输入、汉字识别(手写体联机识别与印刷体脱机识别)、汉字系统及文书处理软件等。词处理平台上最典型、最引人瞩目的应用领域是面向Intemet的、文本不受限的中文检索技术，包括通用搜索引擎、文本自动过滤(如对网上不健康内容或对国家安全有危害内容的过滤)、文本自动分类(在数字图书馆中将得到应用)以及个性化服务软件等.目前影响比较大的商品化中文通用搜索引擎有雅虎、搜狐、新浪网等，但这些只用了基于字的全文检索技术，或者仅做了简单的分词处理，性能还有待于提高。国内研究机构做得比较好的是北京大学的天网，它用了中文分词和词性自动标注技术，但不足之处在于覆盖能力有限，设计上也稍嫌粗糙。词平台上另一个重要应用是语音识别。单纯依赖语音信号处理手段来大幅度提高识别的准确率，已经很难再有大的作刀了，必须要借助文本的后处理技术.现在第一意概述最具代表的产品是IBM的中文ViaVioce微软中国研究院也有表现不俗且接近实用的系统。国内在做这方面工作的有清华大学计算机系、电子系、中科院声学所和自动化所等，但从技术走向市场还有一段距离。属于这个平台的其他应用还有文本自动校对、汉字简繁体自动转换等。句处理平台上的重要应用主要有两方面:一是机器翻译，虽然目前机器翻译的质量还远远不能令人满意，但挂靠在Internet上，就找到了适当的舞台，无论对中国人了解世界(英译汉)，还是外国人了解中国(汉译英)，都大有裨益，潜在的市场十分可观。“金山快译”软件受到市场的欢迎，就是一个有说服力的旁证。此外，雅信诚公司推出的针对专业翻译人员的英汉翻译辅助工具CAT，虽然没有采用全自动翻译的策略，但定位及思路都非常好，不失为另一个有前途的发展方向。句处理平台上另一方面的重要应用是汉语文语转换，不诉诸句法分析技术以获得句子的韵律结构，要获得理想的自然度是不可能的。“金山词霸”里嵌入了英文文语转换技术，相信用户将对这一功能有深刻的印象。总的说来，字平台研究己快成昨日黄花;句平台上的研究还很薄弱，离实用还有一段距离;而词平台上的研究，难度较句平台容易，且经过十几年的努力，成果也比较扎实，随着Intemet的发展，己经到了厚积薄发的时候。 1.2语音识别的发展历史与现状关于语音识别的第一篇论文是1952年美国贝尔实验室发表的关于孤立数字识别系统的研究论文。接着美国的RCA研究所进行了单音节识别系统的研究。在非特定人语音识别方面的尝试，是1959年美国MIT研制的元音识别装置。到六十年代中后期，语音识别作为一个重要的研究课题而展开，并且逐步取得实质性的进展。这是因为一方面计算机产业的发展提出了使用的要求，同时又提供了实现复杂算法的软硬件环境;另一方面数字信号处理的理论和算法在那个时代取得飞跃的进展，如快速傅里叶变换(FFT)、倒谱计算、线性预测分析(LPC), 数字滤波等。日本学者板仓(Itakura)将动态规划(DP)的概念用于解决孤立字识别时说话速度不均匀的问题，提出了著名的动态时间弯曲算法(DTW)e 早期的语音识别系统都是按照简单的模板匹配原理工作的特定人、小词汇表、孤立词识别系统。DTW算法克服了说话人语速不均匀造成的时间伸缩变化的影响，使系统的性能有了显著的提高。但是对于更高