- 1、本文档共18页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语音信号处理的未来发展和应用前景
程盛强071430115
【摘 要】 :随着电子计算机和人工智能机器的广泛应用,人们发现,人和机器 之间最好的通信方式是语言通信,而语音是语言的声学表现形式,要机器听懂人
讲话,并能说出话来,需要做很多工作,这就是科学工作者研究了几十年的语音
识别和语音合成技术。
【关键字】:语音信号处理,应用,发展,语音识别,语音压缩
正文
当今世界正处于工业时代向信息时代的飞速转变时刻,语音在人类社会中起了 非常重要的作用。随着电子购物、因特网络的普及、多媒体通信及其应用的蓬勃
发展,语音始终是人类互相交流、互相通信的最主要、方便、快捷的信息载体。
语音在人类社会中起了非常重要的作用。在现代信息社会中,小至人们的日常 生活,大到国家大事、世界新闻、社会舆论和各种重要会议,都离不开语言和文 字。随着移动通信的迅猛发展,人们可以随时随地通过电话交流,其中语音压缩 编码技术发挥着重要的作用。社会的不断的进步与发展让各种各样的机器更多的 参与了人类的生产活动和社会活动,因此改善人和机器之间是人对机器的操纵更 加便利就显得越来越重要。随着电子计算机和人工智能机器的广泛应用,人们发 现,人和机器之间最好的通信方式是语言通信,而语音是语言的声学表现形式
要机器听懂人讲话,并能说出话来,需要做很多工作,这就是科学工作者研究了
-可编辑修改-
几十年的语音识别和语音合成技术。上述这些应用领域构成了语音信号处理技术
的主要研究内容。
近年来,普通电话、移动电话和互联网已经普及到家庭。在这些先进的工具中, 语音信号处理中的语音编码和语音合成就有很大贡献。再进一步,可以预料到的 口呼打字机(又称听写机,将语音转换为文字)、语音翻译机等,已经不是梦想而
是提到日程上的研究工作了。
语音信号处理是语音学与数字信号处理技术相结合的交叉学科,它和认知科学、 心理学、语言学、计算机科学、模式识别和人工智能等学科联系紧密。语音信号 处理技术的发展依赖于这些学科的发展,而语音信号处理技术的进步也会促进这 些学科的进步。语音信号处理是一门新兴的边缘学科,它是语音学和数字信号处 理两个学科相结合的产物。它和认知学、心理学、语言学、计算机科学、模式识 别和人工智能等学科有着紧密的联系。语音信号处理的发展依赖于这些学科的发 展,而语音信号处理技术的进步也会促进这些领域的进步。语音信号处理的目
的就是要得到某些语音特征参数以便高效地传输或储存;或者是通过某种处理运
算以达到某种用途的要求,例如人工合成语音、辨识出讲话者、识别出讲话的内
容等。
20 世 纪 6 0 年代中期形成的一系列数字信号处理方法和算法,如数字滤波器、 快速傅里叶变换(FFT)是语音数字信号处理的理论和技术基础。而70 年代初期 产生的线性预测编码(LPC)算法,为语音信号的数字处理提供了一个强有力的工 具。语音信号的编码和压缩是语音信号处理的主要内容。语音信号处理在通信、 语音识别与合成、自然语言理解、多媒体数据库以及互联网等多个领域有广泛的
应用,同时它对于理解音频类等一般的声音媒体的特点也有很大的帮助。对于移
可编辑修改-
动通信来说,最多的信息是语音信号,语音编码的技术在数字移动通信中具有相 当关键的作用,高质量低速率的语音编码技术是数字移动网的永远的追求。所谓 语音编码是信源编码,它是将模拟语音信号变成数字信号以便在信道中传输。除 了通信带宽的要求外,计算机存储容量的限制也要求对语音信号进行压缩,以满
足海量数据情况下进行实时或准实时计算机处理的目的。
语音信号处理的关键技术
语音信号处理的理论基础就是一般的数字信号处理理论,它的主要研究内容
是语音编码和语音压缩技术。考虑到人对听觉媒体的感应特点,研究语音信号处 理必须与声音心理学联系起来。因此这里我们把声音心理学也列为语音信号处理
的关键技术之一。
(1)声音心理学
声音的物理属性和心理属性既有联系也有区别。声音有两个最明显的量纲,即 响度和音调,其它还有音色、谐和、不谐和和乐音等等。物理属性主要有强度和 频率。声音的正弦波的强度增加,声的响度也增加;频率增加,音调则增高。但 这些关系不是线性的,且是耦合的,如频率的变化既影响响度也影响音调。其数 量上的关系可以用等响曲线等来描述。但更精确。关系复杂,难以建立量化模
型。如即使想从客观上给出声音失真度的度量都很困难。
人的大脑处理听觉信息还有一些特性,产生了一些客观存在的效应,如屏蔽效
应。声的响度不仅取决于自身的强度和频率,而且也依同时出现的其它声音而定。 各种声音可以互相掩蔽, 一种声音的出现可能使得另一种声音难于听清。它分为 听觉屏蔽、频谱屏蔽和瞬态屏蔽。频谱屏蔽是高电平音调使附近频率的低电平声
音不能被人耳听到。声音的屏蔽特性可以用于声音特
文档评论(0)