语音信号与文本信息的智能处理供参习.docVIP

语音信号与文本信息的智能处理供参习.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语音信号与文本信息的智能处理供参习

语音信号与文本信息的智能处理 第一章概述 处于 信 息 革命浪潮时代的今天,人们对于各种各样信息的需求与日俱增,同 时人们急切需要更好的信息处理方式。语音,作为人类信息交流的最自然、最有 效、最灵活而又最为广泛使用的途径,越来越引起研究者的关注。文本信息,具 备易于传播,所需存储空间小等特点,也是人们日常生活中最经常使用的交流方 式之一。对语音信号,文本信息的智能处理,正是为了更好地满足人们日益增长 的信息需求。 智能 处 理 是指能模仿人的智能(归纳,抽象,形式推理、联想和自适应等) 的处理.智能(Intelligence)一词源于“Legere。意思是收集、汇集,它通 常指人类的脑力劳动,包括感知、学习、推理和判断等;有人把它定义成是随外 界尖化的一种正确的反应能力。人的智能现在己能让电脑机器模仿的主要是学 习、推理、联想、判断与自适应的智能。本文着重研究了语音信号与文本信息的 智能处理。虽然文本信息和语音信号表面上看起来没有直接的联系,但是对两者 的处理方法却有很大的相似之处。因为无论是文本相似判别中使用的特征矢量判 别比较,或者是端点检测中利用的判断方法,实际上都是在某一个特定的空间中 比较两个矢量的某种距离。说到底,两种处理手段都是一致的。 1.1中文信息处理研究的历史与现状 概括 地 说 ,中文信息处理可分为字处理平台、词处理平台和句处理平台这3 个层次。 字处 理 平 台的研究与开发,包括汉字编码输入、汉字识别(手写体联机识别 与印刷体脱机识别)、汉字系统及文书处理软件等。 词处理平台上最典型、最引人瞩目的应用领域是面向Intemet的、文本不受限的 中文检索技术,包括通用搜索引擎、文本自动过滤(如对网上不健康内容或对国 家安全有危害内容的过滤)、文本自动分类(在数字图书馆中将得到应用)以及 个性化服务软件等.目前影响比较大的商品化中文通用搜索引擎有雅虎、搜狐、 新浪网等,但这些只用了基于字的全文检索技术,或者仅做了简单的分词处理, 性能还有待于提高。国内研究机构做得比较好的是北京大学的天网,它用了中文 分词和词性自动标注技术,但不足之处在于覆盖能力有限,设计上也稍嫌粗糙。 词平台上另一个重要应用是语音识别。单纯依赖语音信号处理手段来大幅度提高 识别的准确率,已经很难再有大的作刀了,必须要借助文本的后处理技术.现在 第一意概述 最具代表的产品是IBM的中文ViaVioce微软中国研究院也有表现不俗且接近 实用的系统。国内在做这方面工作的有清华大学计算机系、电子系、中科院声学 所和自动化所等,但从技术走向市场还有一段距离。属于这个平台的其他应用还 有文本自动校对、汉字简繁体自动转换等。 句处 理 平 台上的重要应用主要有两方面:一是机器翻译,虽然目前机器翻译 的质量还远远不能令人满意,但挂靠在Internet上,就找到了适当的舞台,无论 对中国人了解世界(英译汉),还是外国人了解中国(汉译英),都大有裨益,潜 在的市场十分可观。“金山快译”软件受到市场的欢迎,就是一个有说服力的旁 证。此外,雅信诚公司推出的针对专业翻译人员的英汉翻译辅助工具CAT,虽 然没有采用全自动翻译的策略,但定位及思路都非常好,不失为另一个有前途的 发展方向。句处理平台上另一方面的重要应用是汉语文语转换,不诉诸句法分析 技术以获得句子的韵律结构,要获得理想的自然度是不可能的。“金山词霸”里 嵌入了英文文语转换技术,相信用户将对这一功能有深刻的印象。 总的 说 来 ,字平台研究己快成昨日黄花;句平台上的研究还很薄弱,离实用 还有一段距离;而词平台上的研究,难度较句平台容易,且经过十几年的努力, 成果也比较扎实,随着Intemet的发展,己经到了厚积薄发的时候。 1.2语音识别的发展历史与现状 关于 语 音 识别的第一篇论文是1952年美国贝尔实验室发表的关于孤立数字 识别系统的研究论文。接着美国的RCA研究所进行了单音节识别系统的研究。在 非特定人语音识别方面的尝试,是1959年美国MIT研制的元音识别装置。 到六 十 年 代中后期,语音识别作为一个重要的研究课题而展开,并且逐步取 得实质性的进展。这是因为一方面计算机产业的发展提出了使用的要求,同时又 提供了实现复杂算法的软硬件环境;另一方面数字信号处理的理论和算法在那个 时代取得飞跃的进展,如快速傅里叶变换(FFT)、倒谱计算、线性预测分析(LPC), 数字滤波等。日本学者板仓(Itakura)将动态规划(DP)的概念用于解决孤立 字识别时说话速度不均匀的问题,提出了著名的动态时间弯曲算法(DTW)e 早期 的 语 音识别系统都是按照简单的模板匹配原理工作的特定人、小词汇 表、孤立词识别系统。DTW算法克服了说话人语速不均匀造成的时间伸缩变化的 影响,使系统的性能有了显著的提高。但是对于更高

文档评论(0)

dart002 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档