语音信号处理作业2 .pdfVIP

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

语音信号处理的发展历程及发展趋势

201105028

摘要:文章简要介绍了语音信号处理这一分支学科形成和发展的历史过程.指

出了它在现代信息科学技术中的地位和作用.介绍了语音信号处理在应用领域的

一些重要课题,如语音的低速率编码,语音的规则合成和文-语转换系统,语音识

别和人-机语音对话等,这些仍然是当前研究的热点.文章最后展望了语音信号处

理的发展前景,指出在这个领域还有很多难题等待人们去研究探索.

关键词语音信号处理,语音低速编码,语音识别

发展历程

声学是物理学的一个分支学科,而语言声学又是声学的一个分支学科.它主要的

研究方向是人的发声器官机理,发声器官的类比线路和数学模型,听觉器官的特

性(如听阈、掩蔽、临界带宽、听力损失等),听觉器官的数学模型,语音信号的物

理特性(如频谱特性、声调特性、相关特性、概率分布等),语音的清晰度和可懂

度等.当今通信和广播的发展非常迅速,而语言通信和语言广播仍然是最重要的

部分,语言声学则是这些技术科学的基础.

语言声学的发展和电子学、计算机科学有着非常密切的关系.在它发展的过

程中,有过几次飞跃.第一次飞跃是1907年电子管的发明和1920年无线电广播的

出现.因为有了电子管放大器,很微弱的声音也可以放大,而且可以定量测量.从

而使电声学和语言声学的一些研究成果,扩展到通信和广播部门.第二次飞跃应

该是在20世纪70年代初,由于电子计算机和数字信号处理的发展,人们发现:声

音信号特别是语音信号,可以通过模数转换器(A/D)采样和量化,它们转换为数字

信号后,能够送进计算机.这样就可以用数字计算方法,对语音信号进行处理和加

工.例如频谱分析可以用傅里叶变换或快速傅里叶变换(FFT)实现,数字滤波器可

以用差分方程实现.在这个基础上,逐渐形成了一门新学科)))语音信号处理.它

的发展很快,在通信、自动控制等领域,解决了很多用传统方法难以解决的问题.

在信息科学中占有很重要的地位.

语音信号处理在信息科学中的地位和作用

众所周知,语音在人类社会中起了非常重要的作用.在现代信息社会中,小至

人们的日常生活,大到国家大事、世界新闻、社会舆论和各种重要会议,都离不开

语言和文字.近年来,普通电话、移动电话和互联网已经普及到家庭.在这些先进

的工具中,语音信号处理中的语音编码和语音合成就有很大贡献.再进一步,可以

预料到的口呼打字机(又称听写机,它能把语音转换为文字)、语音翻译机(例如输

入为汉语,输出为英语,或者相反),已经不是梦想而是提到日程上的研究工作了.

人们早就希望用语音指挥机器,机器的执行情况也能用语音回答.这在某些领域

已经部分地实现了.目前计算机芯片的集成度和运算能力,每18个月就提高一倍,

而成本又不断降低,因此,它已经广泛地应用于在社会生产和生活的各个方面.然

而计算机接收信息的外围设备和主机相比,要逊色得多.能说能听的计算机还不

能普遍使用.也就是说:语音识别、语音理解和语音合成等课题,还有很多理论问

题和技术问题没有解决,需要继续深入研究.

科学家们深入研究后认为,要解决人-机语音对话这样的难题,做出真正实用

的语音机器,必须开展跨学科的研究,如声学、语言学、语音学、生理学、数字信

号处理、人工智能和计算机科学等.要真正赋予微电脑以语言功能,必须彻底了解

语言是如何产生、感知,以及人类的语言通信是如何进行的?图1给出了从语言产

生到语音感知全过程中的几个重要环节.从图1可以看到,要使这个问题得到满

意的解决,需要深入研究人类发声器官和听觉器官机理,建立能反映客观真实情

况的物理模型和数学模型.

图1人类语音通信的过程

语音信号所包含的信息量[1,2]

语音信号中到底包含了多少信息量,需要多少比特才能够无失真地表示它们,

这对于语音编码、语音合成和语音识别的研究都是很有用的.但是这也是一个很

复杂的问题,它涉及到对于信号失真的评价.下面列举了三种评价,其中两种是由

弗累雷格(Flanagan)给出的,另一种是由约翰斯登(Johnston)提出的.它们是建

立在下面三种不同的失真评价上:(1)语音信号的信噪比;(2)接收语音信号时,信

号由听觉外围处理以后,人们在主观上能够感觉到的失真;(3)人在接收语音信号

时,不正确接收音素的数目和正确接收音素数目的比值.

在所有的三种情况下,所得到的比特率是首先选择能够接受的失真等级,然

后,

您可能关注的文档

文档评论(0)

157****8441 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档