- 1、本文档共3页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
语音信号处理技术的发展历程与趋势
学号:201005103
1语音信号处理技术的发展历程
通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息的形式。语言
是人类特有的功能,声音是人类常用的工具,是相互传递信息的最主要手段。它具有最大
的信息容量和最高的只能水平。因此,用现代的手段研究语音处理技术,使人们能更有效
的产生、传输、存储、获取和应用语音信息,对于促进社会发展具有十分重要的的意义。
语音信号处理正是一门研究用数字信号处理技术和语音学知识对语音信号进行处理的
新兴学科,是目前发展最为迅速的信息科学研究领域的核心技术之一,同时又是综合性的
多学科领域和涉及面很广的交叉学科。语音信号处理的理论和研究包括紧密结合的两个方
面:一方面是从语音的产生和感知来对其进行研究,这一研究语音.语言学、认知科学、心
理.生理学等学科密不可分。另一方面是将语音作为一种信号来进行处理,包括传统的数字
信号处理技术以及一些新的应用与语音信号的处理方法和技术。
20世纪60年代中期形成的一系列数字信号处理方法和算法,如数字滤波器、快速
傅里叶变换(FFT)是语音数字信号处理的理论和技术基础。
而70年代初期产生的线性预测编码(LPC)算法,为语音信号的数字处理提供了一
个强有力的工具。广泛的应用于语音信号的分析、合成及各个应用领域,以及用于输入语
音与参考样本之间时间匹配的动态规划方法。
80年代初一种新的基于聚类分析的高效数据压缩技术——矢量量化(VQ)应用于语
音信号处理中。而用隐马尔可夫模型(HMM)描述语音信号过程的产生是80年代语音信
号处理技术的重大发展,语音信号处理的各项课题是促进其发展的重要动力之一,同时它
的许多成果也体现在有关语音信号处理的各项技术之中。
进入20世纪90年代以来,语音信号处理在实用化方面取得了许多实质性的研究进
展。其中,语音识别逐渐由实验室走向实用化。一方面,对声学语音学统计模型的研究逐
渐深入,鲁棒的语音识别、基于语音段的建模方法及隐马尔可夫模型与人工神经网络的结
合成为研究的热点。另一方面,为了语音识别实用化的需要,讲者自适应、听觉模型、快
速搜索识别算法以及进一步的语言模型的研究等课题倍受关注。语音信号的编码和压缩是
语音信号处理的主要内容。语音信号处理在通信语音识别与合成、自然语音理解、多媒体
数据库以及互联网等多个领域有广泛的应用,同时它对于理解音频类等一般的声音媒体的
特点也有很大的帮助。对于移动通信来说,最多的信息是语音信号,语音编码的技术在数
字移动通信中具有相当关键的作用。高质量低速率的语音编码技术是数字移动网的永远
的追求。所谓语音编码是信源编码,它是将模拟语音信号编程数字信号以便在信道中传输。
除了通信带宽的要求外,计算机存储容量的限制也要求对语音信号进行压缩,以满足海量
数据情况下进行实时或准实时计算机处理的目的。语音信号数字处理技术在国民经济、日
常生活和军事领域有着极为重要的应用价值和极其广阔的应用空间。众所周知,语音在人
类社会中起了非常重要的作用。在现代信息社会中,小至人们的日常生活,大到国家大事、
世界新闻、社会舆论和各种重要会议,都离不开语言和文字。近年来,普通电话、移动电
话和互联网已经普及到家庭。在这些先进的工具中,语音信号处理中的语音编码和语音合
成就有很大贡献。再进一步,可以预料到的口呼打字机(又称听写机,它能把语音转换为文
字)、语音翻译机(例如输入为汉语,输出为英语,或者相反),已经不是梦想而是提到日程
上的研究工作了。
2语音信号处理的内容
2.1语音信号所包含的信息量
语音信号中到底包含了多少信息量,需要多少比特才能够无失真地表示它们,这对于语音编
码、语音合成和语音识别的研究都是很有用的。但是这也是一个很复杂的问题,它涉及到
对于信号失真的评价。下面列举了三种评价,其中两种是由弗雷雷格(Flanagan)给出的,另
一种是由约翰斯登(Johnston)提出的。它们是建立在下面三种不同的失真评价上:(1)语音信
号的信噪比;(2)接收语音信号时,信号由听觉外围处理以后,人们在主观上能够感觉到的
失真;(3)人在接收语音信号时,不正确接收音素的数目和正确接收音素数目的比值。
2.2语音信号分析
语音信号分析是语音信号处理的前提和基础,只有分析出可表示语音信号本质特征的参
数,才可能利用这些参数进行高效的语音通
文档评论(0)