- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语音信号与文本信息的智能处理供参习
语音信号与文本信息的智能处理
第一章概述
处于 信 息 革命浪潮时代的今天,人们对于各种各样信息的需求与日俱增,同
时人们急切需要更好的信息处理方式。语音,作为人类信息交流的最自然、最有
效、最灵活而又最为广泛使用的途径,越来越引起研究者的关注。文本信息,具
备易于传播,所需存储空间小等特点,也是人们日常生活中最经常使用的交流方
式之一。对语音信号,文本信息的智能处理,正是为了更好地满足人们日益增长
的信息需求。
智能 处 理 是指能模仿人的智能(归纳,抽象,形式推理、联想和自适应等)
的处理.智能(Intelligence)一词源于“Legere。意思是收集、汇集,它通
常指人类的脑力劳动,包括感知、学习、推理和判断等;有人把它定义成是随外
界尖化的一种正确的反应能力。人的智能现在己能让电脑机器模仿的主要是学
习、推理、联想、判断与自适应的智能。本文着重研究了语音信号与文本信息的
智能处理。虽然文本信息和语音信号表面上看起来没有直接的联系,但是对两者
的处理方法却有很大的相似之处。因为无论是文本相似判别中使用的特征矢量判
别比较,或者是端点检测中利用的判断方法,实际上都是在某一个特定的空间中
比较两个矢量的某种距离。说到底,两种处理手段都是一致的。
1.1中文信息处理研究的历史与现状
概括 地 说 ,中文信息处理可分为字处理平台、词处理平台和句处理平台这3
个层次。
字处 理 平 台的研究与开发,包括汉字编码输入、汉字识别(手写体联机识别
与印刷体脱机识别)、汉字系统及文书处理软件等。
词处理平台上最典型、最引人瞩目的应用领域是面向Intemet的、文本不受限的
中文检索技术,包括通用搜索引擎、文本自动过滤(如对网上不健康内容或对国
家安全有危害内容的过滤)、文本自动分类(在数字图书馆中将得到应用)以及
个性化服务软件等.目前影响比较大的商品化中文通用搜索引擎有雅虎、搜狐、
新浪网等,但这些只用了基于字的全文检索技术,或者仅做了简单的分词处理,
性能还有待于提高。国内研究机构做得比较好的是北京大学的天网,它用了中文
分词和词性自动标注技术,但不足之处在于覆盖能力有限,设计上也稍嫌粗糙。
词平台上另一个重要应用是语音识别。单纯依赖语音信号处理手段来大幅度提高
识别的准确率,已经很难再有大的作刀了,必须要借助文本的后处理技术.现在
第一意概述
最具代表的产品是IBM的中文ViaVioce微软中国研究院也有表现不俗且接近
实用的系统。国内在做这方面工作的有清华大学计算机系、电子系、中科院声学
所和自动化所等,但从技术走向市场还有一段距离。属于这个平台的其他应用还
有文本自动校对、汉字简繁体自动转换等。
句处 理 平 台上的重要应用主要有两方面:一是机器翻译,虽然目前机器翻译
的质量还远远不能令人满意,但挂靠在Internet上,就找到了适当的舞台,无论
对中国人了解世界(英译汉),还是外国人了解中国(汉译英),都大有裨益,潜
在的市场十分可观。“金山快译”软件受到市场的欢迎,就是一个有说服力的旁
证。此外,雅信诚公司推出的针对专业翻译人员的英汉翻译辅助工具CAT,虽
然没有采用全自动翻译的策略,但定位及思路都非常好,不失为另一个有前途的
发展方向。句处理平台上另一方面的重要应用是汉语文语转换,不诉诸句法分析
技术以获得句子的韵律结构,要获得理想的自然度是不可能的。“金山词霸”里
嵌入了英文文语转换技术,相信用户将对这一功能有深刻的印象。
总的 说 来 ,字平台研究己快成昨日黄花;句平台上的研究还很薄弱,离实用
还有一段距离;而词平台上的研究,难度较句平台容易,且经过十几年的努力,
成果也比较扎实,随着Intemet的发展,己经到了厚积薄发的时候。
1.2语音识别的发展历史与现状
关于 语 音 识别的第一篇论文是1952年美国贝尔实验室发表的关于孤立数字
识别系统的研究论文。接着美国的RCA研究所进行了单音节识别系统的研究。在
非特定人语音识别方面的尝试,是1959年美国MIT研制的元音识别装置。
到六 十 年 代中后期,语音识别作为一个重要的研究课题而展开,并且逐步取
得实质性的进展。这是因为一方面计算机产业的发展提出了使用的要求,同时又
提供了实现复杂算法的软硬件环境;另一方面数字信号处理的理论和算法在那个
时代取得飞跃的进展,如快速傅里叶变换(FFT)、倒谱计算、线性预测分析(LPC),
数字滤波等。日本学者板仓(Itakura)将动态规划(DP)的概念用于解决孤立
字识别时说话速度不均匀的问题,提出了著名的动态时间弯曲算法(DTW)e
早期 的 语 音识别系统都是按照简单的模板匹配原理工作的特定人、小词汇
表、孤立词识别系统。DTW算法克服了说话人语速不均匀造成的时间伸缩变化的
影响,使系统的性能有了显著的提高。但是对于更高
文档评论(0)