数字语音信号处理的应用价值及发展趋势.docVIP

数字语音信号处理的应用价值及发展趋势.doc

  1. 1、本文档共19页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数字语音信号处理的应用价值及发展趋势

数字语音信号处理的应用价值及发展趋势 ? 姓名:宁闯 ? ? ? ? 学号: 201005107? 众所周知, 语音在人类社会中起了非常重要的作用。 在现代信息社会中, 小至人们的日 常生活,大到国家大事、世界新闻、社会舆论和各种重要会议,都离不开语言和文字。近年 来,普通电话、 移动电话和互联网已经普及到家庭。在这些先进的工具中, 语音信号处理中 的语音编码和语音合成就有很大贡献。再进一步,可以预料到的口呼打字机 ( 又称听写机, 它能把语音转换为文字 ) 、 语音翻译机 ( 例如输入为汉语,输出为英语, 或者相反 ) ,已经不是 梦想而是提到日程上的研究工作了。 ? 20? 世纪 ? 60? 年代中期形成的一系列数字信号处理方法和算法 ,? 如数字滤波器、快速傅 里叶变换 (FFT) 是语音数字信号处理的理论和技术基础。而 70? 年代初期产生的线性预测编 码 (LPC) 算法 ,? 为语音信号的数字处理提供了一个强有力的工具。语音信号的编码和压缩是 语音信号处理的主要内容。语音信号处理在通信、 语音识别与合成、自然语言理解、多媒体 数据库以及互联网等多个领域有广泛的应用 ,? 同时它对于理解音频类等一般的声音媒体的 特点也有很大的帮助。对于移动通信来说 ,? 最多的信息是语音信号 ,? 语音编码的技术在数字 移动通信中具有相当关键的作用 ,? 高质量低速率的语音编码技术是数字移动网的永远的追 求。所谓语音编码是信源编码 ,? 它是将模拟语音信号变成数字信号以便在信道中传输。除了 通信带宽的要求外 ,? 计算机存储容量的限制也要求对语音信号进行压缩 ,? 以满足海量数据情 况下进行实时或准实时计算机处理的目的。 ? 1 ? 语音信号处理的关键技术 ? 语音信号处理的理论基础就是一般的数字信号处理理论 ,? 它的主要研究内容是语音编 码和语音压缩技术。 考虑到人对听觉媒体的感应特点 ,? 研究语音信号处理必须与声音心理学 联系起来。因此这里我们把声音心理学也列为语音信号处理的关键技术之一。 ? (1) 声音心理学 ? 声音的物理属性和心理属性既有联系也有区别。 声音有两个最明显的量纲 ,? 即响度和音 调 ,? 其它还有音色、谐和、不谐和和乐音等等。物理属性主要有强度和频率。声音的正弦波 的强度增加 ,? 声的响度也增加 ;? 频率增加 ,? 音调则增高。 但这些关系不是线性的 ,? 且是耦合的 ,? 如频率的变化既影响响度也影响音调。其数量上的关系可以用等响曲线 ? 等来描述。但更精 确。关系复杂 ,? 难以建立量化模型。如即使想从客观上给出声音失真度的度量都很困难。 ? 人的大脑处理听觉信息还有一些特性 , 产生了一些客观存在的效应 ,? 如屏蔽效应。 声的响 度不仅取决于自身的强度和频率 ,? 而且也依同时出现的其它声音而定。 各种声音可以互相掩 蔽 ,? 一种声音的出现可能使得另一种声音难于听清。 它分为听觉屏蔽、 频谱屏蔽和瞬态屏蔽。 频谱屏蔽是高电平音调使附近频率的低电平声音不能被人耳听到。 声音的屏蔽特性可以用于 声音特别是语音信号的压缩。 ? (2) 语音编码 ? 语音编码分为三类 :? 波形编码、参量编码和混合编码。 ? 波形编码是将时域信号直接变换为数字代码 ,? 其目的是尽可能精确地再现原来的话音波形。 自适应量化、自适应比特分配和矢量量化等等。 ? 2 ? 在语音识别与合成中的应用 ? ? ? ? ? 语音识别的研究是从 20? 世纪 50? 年代开始的 ,? 但直到 60? 年代中期才取得了实质性进 展 ,? 其重要标志就是日本学者 Itakura? 将动态规划算法用于解决语音识别中语速多变的难题 ,? 提出了动态时间收缩算法 (DTW:Dy2nam? ic? TimeW? arping) 。其基本思想是 :? 在训练阶段 ,? 从 词汇表中通过语音信号处理技术提出每个词的特征向量 ( 时域特征、频域特征、尺度特征及 联合分布特征 ),? 作为标准模板存入模板库中。 在识别阶段 ,? 将输入语音的特征向量依次与模 板库中的各个标准模板进行比较 ,? 计算类似度 ,? 将类似度最高的标准模板所对应的词汇输 出。在这里和一般的模式识别不一样 ,? 存在几个问题 :? 说话者语速不一致的问题 ;? 大词汇表 的问题导致计算量大的问题 ;? 协同发音的问题 ( 即同一音素的发音随上下文不同而变化 );? 对 于非特定人语音识别 ,? 还有一个语音多变性的困难。 ? ? ? ? ? 语音识别的这些问题 ,? 除了在优化算法上应有所突破外 ,? 一个最根本的问题是语音特征 量的提取问题。 目前能够用于模板匹配的特征向量还不能达到少而精的要求。 能够反映特定 人和非特定人在语速变化下的不变特征量、 在连续语音识

文档评论(0)

kakaxi + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档