- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
中原工学院电子信息学院信息091班***
语音信号分析与应用
(郑州中原工学院电子信息学院)
摘要:文章简要介绍了“语音信号处理”这一分支学科形成和发展的历史过程,
指出了它在现代信息科学技术中的地位和作用。为了区分该语音的清音段与浊音
段,提出一种短时幅度和短时过零率相结合的方法。分析比较了短时幅度和短时
过零率分别出现的不同结果。短时幅度值Mn大的对应于浊音段,而Mn值小的对
应于清音段。高平均过零率对应于清音,低平均过零率对应于浊音,分析结果表
明将短时幅度和短时过零率结合起来的方法可以大体上区分清音段和浊音段。语
音信号频谱分析包含极其丰富的内容。短时谱、LPC谱、倒谱、LPC倒谱等多种
常用频谱的概念,分析比较了上述频谱各自的特性及相互关系,并用软件编程
实现计算机仿真,讨论各种频谱的实际应用。
关键词:语音频谱短时谱LPC谱倒谱语音短时幅度短时过零率
1、简要历史回顾
声学是物理学的一个分支学科,而语言声学又是声学的一个分支学科。它主
要的研究方向是人的发声器官机理,发声器官的类比线路和数学模型,听觉器官
的特性(如听阈、掩蔽、临界带宽、听力损失等),听觉器官的数学模型,语音
信号的物理特性(如频谱特性、声调特性、相关特性、概率分布等),语音的清
晰度和可懂度等。当今通信和广播的发展非常迅速,而语言通信和语言广播仍
然是最重要的部分,语言声学则是这些技术科学的基础语言声学的发展和电子
学、计算机科学有着非常密切的关系。在它发展的过程中,有过几次飞跃第一
次飞跃是1907年电子管的发明和1920年无线电广播的出现。因为有了电子管放
大器,很微弱的声音也可以放大,而且可以定量测量。从而使电声学和语言声学
的一些研究成果,扩展到通信和广播部门%第二次飞跃应该是在20世纪70年代初,
由于电子计算机和数字信号处理的发展,人们发现:声音信号特别是语音信号,
可以通过模数转换器(A/D)采样和量化,它们转换为数字信号后,能够送进计
算机。这样就可以用数字计算方法,对语音信号进行处理和加工。例如频谱分析
可以用傅里叶变换或快速傅里叶变换(FFT)实现,数字滤波器可以用差分方程
实现。在这个基础上,逐渐形成了一门新学科———语音信号处理。它的发展
很快,在通信、自动控制等领域,解决了很多用传统方法难以解决的问题。在信
息科学中占有很重要的地位。
2、语音信号处理在信息科学中的地位和作用
语音是语言的声学表现,是人类交流信息的最自然、最有效、最方便的手段。
语音信号处理是一门以语言学和数字信号处理为基础的综合性学科,包括了语音
识别、语音合成、语音编码和说话人识别等四大分支。
众所周知,语音在人类社会中起了非常重要的作用。在现代信息社会中,
小至人们的日常生活,大到国家大事、世界新闻、社会舆论和各种重要会议,都
离不开语言和文字。近年来,普通电话、移动电话和互联网已经普及到家庭。
在这些先进的工具中,语音信号处理中的语音编码和语音合成就有很大贡献。再
进一步,可以预料到的口呼打字机(又称听写机,它能把语音转换为文字)、语
音翻译机(例如输入为汉语,输出为英语,或者相反),已经不是梦想而是提到
1
中原工学院电子信息学院信息091班***
日程上的研究工作了。人们早就希望用语音指挥机器,机器的执行情况也能用语
音回答。这在某些领域已经部分地实现了。目前计算机芯片的集成度和运算能
力,每18个月就提高一倍,而成本又不断降低,因此,它已经广泛地应用于在社
会生产和生活的各个方面。然而计算机接收信息的外围设备和主机相比,要逊色
得多。能说能听的计算机还不能普遍使用。也就是说:语音识别、语音理解和
语音合成等课题,还有很多理论问题和技术问题没有解决,需要继续深入研究。
科学家们深入研究后认为,要解决人机语音对话这样的难题,做出真正实用的语
音机器,必须开展跨学科的研究,如声学、语言学、语音学、生理学、数字信号
处理、人工智能和计算机科学等。要真正赋予微电脑以语言功能,必须彻底了
解语言是如何产生、感知,以及人类的语言通信是如何进行的。
3、四种常用的语音分析方法比较
3
文档评论(0)