- 1、本文档共19页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数字语音信号处理的应用价值及发展趋势
数字语音信号处理的应用价值及发展趋势
?
姓名:宁闯
?
?
?
?
学号:
201005107?
众所周知,
语音在人类社会中起了非常重要的作用。
在现代信息社会中,
小至人们的日
常生活,大到国家大事、世界新闻、社会舆论和各种重要会议,都离不开语言和文字。近年
来,普通电话、
移动电话和互联网已经普及到家庭。在这些先进的工具中,
语音信号处理中
的语音编码和语音合成就有很大贡献。再进一步,可以预料到的口呼打字机
(
又称听写机,
它能把语音转换为文字
)
、
语音翻译机
(
例如输入为汉语,输出为英语,
或者相反
)
,已经不是
梦想而是提到日程上的研究工作了。
?
20?
世纪
?
60?
年代中期形成的一系列数字信号处理方法和算法
,?
如数字滤波器、快速傅
里叶变换
(FFT)
是语音数字信号处理的理论和技术基础。而
70?
年代初期产生的线性预测编
码
(LPC)
算法
,?
为语音信号的数字处理提供了一个强有力的工具。语音信号的编码和压缩是
语音信号处理的主要内容。语音信号处理在通信、
语音识别与合成、自然语言理解、多媒体
数据库以及互联网等多个领域有广泛的应用
,?
同时它对于理解音频类等一般的声音媒体的
特点也有很大的帮助。对于移动通信来说
,?
最多的信息是语音信号
,?
语音编码的技术在数字
移动通信中具有相当关键的作用
,?
高质量低速率的语音编码技术是数字移动网的永远的追
求。所谓语音编码是信源编码
,?
它是将模拟语音信号变成数字信号以便在信道中传输。除了
通信带宽的要求外
,?
计算机存储容量的限制也要求对语音信号进行压缩
,?
以满足海量数据情
况下进行实时或准实时计算机处理的目的。
?
1
?
语音信号处理的关键技术
?
语音信号处理的理论基础就是一般的数字信号处理理论
,?
它的主要研究内容是语音编
码和语音压缩技术。
考虑到人对听觉媒体的感应特点
,?
研究语音信号处理必须与声音心理学
联系起来。因此这里我们把声音心理学也列为语音信号处理的关键技术之一。
?
(1)
声音心理学
?
声音的物理属性和心理属性既有联系也有区别。
声音有两个最明显的量纲
,?
即响度和音
调
,?
其它还有音色、谐和、不谐和和乐音等等。物理属性主要有强度和频率。声音的正弦波
的强度增加
,?
声的响度也增加
;?
频率增加
,?
音调则增高。
但这些关系不是线性的
,?
且是耦合的
,?
如频率的变化既影响响度也影响音调。其数量上的关系可以用等响曲线
?
等来描述。但更精
确。关系复杂
,?
难以建立量化模型。如即使想从客观上给出声音失真度的度量都很困难。
?
人的大脑处理听觉信息还有一些特性
,
产生了一些客观存在的效应
,?
如屏蔽效应。
声的响
度不仅取决于自身的强度和频率
,?
而且也依同时出现的其它声音而定。
各种声音可以互相掩
蔽
,?
一种声音的出现可能使得另一种声音难于听清。
它分为听觉屏蔽、
频谱屏蔽和瞬态屏蔽。
频谱屏蔽是高电平音调使附近频率的低电平声音不能被人耳听到。
声音的屏蔽特性可以用于
声音特别是语音信号的压缩。
?
(2)
语音编码
?
语音编码分为三类
:?
波形编码、参量编码和混合编码。
?
波形编码是将时域信号直接变换为数字代码
,?
其目的是尽可能精确地再现原来的话音波形。
自适应量化、自适应比特分配和矢量量化等等。
?
2
?
在语音识别与合成中的应用
?
?
?
?
?
语音识别的研究是从
20?
世纪
50?
年代开始的
,?
但直到
60?
年代中期才取得了实质性进
展
,?
其重要标志就是日本学者
Itakura?
将动态规划算法用于解决语音识别中语速多变的难题
,?
提出了动态时间收缩算法
(DTW:Dy2nam?
ic?
TimeW?
arping)
。其基本思想是
:?
在训练阶段
,?
从
词汇表中通过语音信号处理技术提出每个词的特征向量
(
时域特征、频域特征、尺度特征及
联合分布特征
),?
作为标准模板存入模板库中。
在识别阶段
,?
将输入语音的特征向量依次与模
板库中的各个标准模板进行比较
,?
计算类似度
,?
将类似度最高的标准模板所对应的词汇输
出。在这里和一般的模式识别不一样
,?
存在几个问题
:?
说话者语速不一致的问题
;?
大词汇表
的问题导致计算量大的问题
;?
协同发音的问题
(
即同一音素的发音随上下文不同而变化
);?
对
于非特定人语音识别
,?
还有一个语音多变性的困难。
?
?
?
?
?
语音识别的这些问题
,?
除了在优化算法上应有所突破外
,?
一个最根本的问题是语音特征
量的提取问题。
目前能够用于模板匹配的特征向量还不能达到少而精的要求。
能够反映特定
人和非特定人在语速变化下的不变特征量、
在连续语音识
您可能关注的文档
最近下载
- 高考英语写作-应用文12类范文背诵备考.docx VIP
- 融入知识图谱的大模型以及应用方案设计.pptx VIP
- 语文教育测量与评价:第一章语文考试历史概述.ppt VIP
- 索尼特丽珑彩监_bvm20f1u_bvm20f1e_bvm20e1u_bvm20e1e_bvm14f1u_bvm14f1e_bvm14e1u_bvm14e1e_bvm14f5u_bvm14f5e_bv.pdf VIP
- 海虹文件培训7涂装工艺.pptx VIP
- 中山大学无机化学第5章原子结构与周期表习题及答案.docx VIP
- 乙肝患者的护理.pptx VIP
- DeepSeek使用技巧及应用案例分享.pptx VIP
- 2024移动金融客户端应用软件安全管理规范标准.docx VIP
- 消化道出血的护理(共23张PPT).pptx VIP
文档评论(0)