- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
语音信号处理的发展历程及发展趋势
201105028
摘要:文章简要介绍了语音信号处理这一分支学科形成和发展的历史过程.指
出了它在现代信息科学技术中的地位和作用.介绍了语音信号处理在应用领域的
一些重要课题,如语音的低速率编码,语音的规则合成和文-语转换系统,语音识
别和人-机语音对话等,这些仍然是当前研究的热点.文章最后展望了语音信号处
理的发展前景,指出在这个领域还有很多难题等待人们去研究探索.
关键词语音信号处理,语音低速编码,语音识别
发展历程
声学是物理学的一个分支学科,而语言声学又是声学的一个分支学科.它主要的
研究方向是人的发声器官机理,发声器官的类比线路和数学模型,听觉器官的特
性(如听阈、掩蔽、临界带宽、听力损失等),听觉器官的数学模型,语音信号的物
理特性(如频谱特性、声调特性、相关特性、概率分布等),语音的清晰度和可懂
度等.当今通信和广播的发展非常迅速,而语言通信和语言广播仍然是最重要的
部分,语言声学则是这些技术科学的基础.
语言声学的发展和电子学、计算机科学有着非常密切的关系.在它发展的过
程中,有过几次飞跃.第一次飞跃是1907年电子管的发明和1920年无线电广播的
出现.因为有了电子管放大器,很微弱的声音也可以放大,而且可以定量测量.从
而使电声学和语言声学的一些研究成果,扩展到通信和广播部门.第二次飞跃应
该是在20世纪70年代初,由于电子计算机和数字信号处理的发展,人们发现:声
音信号特别是语音信号,可以通过模数转换器(A/D)采样和量化,它们转换为数字
信号后,能够送进计算机.这样就可以用数字计算方法,对语音信号进行处理和加
工.例如频谱分析可以用傅里叶变换或快速傅里叶变换(FFT)实现,数字滤波器可
以用差分方程实现.在这个基础上,逐渐形成了一门新学科)))语音信号处理.它
的发展很快,在通信、自动控制等领域,解决了很多用传统方法难以解决的问题.
在信息科学中占有很重要的地位.
语音信号处理在信息科学中的地位和作用
众所周知,语音在人类社会中起了非常重要的作用.在现代信息社会中,小至
人们的日常生活,大到国家大事、世界新闻、社会舆论和各种重要会议,都离不开
语言和文字.近年来,普通电话、移动电话和互联网已经普及到家庭.在这些先进
的工具中,语音信号处理中的语音编码和语音合成就有很大贡献.再进一步,可以
预料到的口呼打字机(又称听写机,它能把语音转换为文字)、语音翻译机(例如输
入为汉语,输出为英语,或者相反),已经不是梦想而是提到日程上的研究工作了.
人们早就希望用语音指挥机器,机器的执行情况也能用语音回答.这在某些领域
已经部分地实现了.目前计算机芯片的集成度和运算能力,每18个月就提高一倍,
而成本又不断降低,因此,它已经广泛地应用于在社会生产和生活的各个方面.然
而计算机接收信息的外围设备和主机相比,要逊色得多.能说能听的计算机还不
能普遍使用.也就是说:语音识别、语音理解和语音合成等课题,还有很多理论问
题和技术问题没有解决,需要继续深入研究.
科学家们深入研究后认为,要解决人-机语音对话这样的难题,做出真正实用
的语音机器,必须开展跨学科的研究,如声学、语言学、语音学、生理学、数字信
号处理、人工智能和计算机科学等.要真正赋予微电脑以语言功能,必须彻底了解
语言是如何产生、感知,以及人类的语言通信是如何进行的?图1给出了从语言产
生到语音感知全过程中的几个重要环节.从图1可以看到,要使这个问题得到满
意的解决,需要深入研究人类发声器官和听觉器官机理,建立能反映客观真实情
况的物理模型和数学模型.
图1人类语音通信的过程
语音信号所包含的信息量[1,2]
语音信号中到底包含了多少信息量,需要多少比特才能够无失真地表示它们,
这对于语音编码、语音合成和语音识别的研究都是很有用的.但是这也是一个很
复杂的问题,它涉及到对于信号失真的评价.下面列举了三种评价,其中两种是由
弗累雷格(Flanagan)给出的,另一种是由约翰斯登(Johnston)提出的.它们是建
立在下面三种不同的失真评价上:(1)语音信号的信噪比;(2)接收语音信号时,信
号由听觉外围处理以后,人们在主观上能够感觉到的失真;(3)人在接收语音信号
时,不正确接收音素的数目和正确接收音素数目的比值.
在所有的三种情况下,所得到的比特率是首先选择能够接受的失真等级,然
后,
您可能关注的文档
- 谈水利工程建设问题及对策---以引江济淮工程为例 .pdf
- 语音信号处理课程实验教学大纲 .pdf
- 语文修辞手法总结比喻拟人夸张等 .pdf
- 试验检测题库(带答案) .pdf
- 识别方言种类的方法和设备的制作流程 .pdf
- 访石川岛(上海)管理有限公司总经理藤森洋一 .pdf
- 设备销售合同模板 .pdf
- 设备转让协议书范文 .pdf
- 设备出售合同范本三篇 .pdf
- 论视觉感知与图形设计 .pdf
- 湖南省湖湘C13教育联盟2023-2024学年九年级上学期第三次月考语文试题(解析版).docx
- 河南省项城市第三高级中学2024-2025学年高三上学期第二次考试(期中)历史试题(原卷版).docx
- 湖南省岳阳市岳阳县岳阳经济技术开发区长岭中学2023-2024学年九年级上学期12月月考语文试题(解析版).docx
- 河南省安阳市林州市2024-2025学年八年级上学期期中历史试题.docx
- 河南省郑州市宇华实验学校2024-2025学年高三上学期11月期中考试政治试题(原卷版).docx
- 独山中学2024~2025学年度第一学期高三第三次阶段性考试政治参考答案.docx
- 河南省新乡市部分学校2024-2025学年高三上学期期中联考政治试题(解析版).docx
- 河南省新乡市部分学校2024-2025学年高三上学期期中联考政治试题(原卷版).docx
- 河南省鹤壁市联考2024-2025学年九年级上学期11月期中考试英语试题.docx
- 河南省商丘市实验中学2023-2024学年九年级上学期12月月考语文试题(解析版).docx
文档评论(0)