- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
会计学;引言
语音识别系统构成
语音信号的小波去噪
语音信号的端点检测
语音特征的提取
基于DTW的语音识别算法
实验结果及分析; 让计算机能听懂人类的语言,是人类自计算机诞生以来梦寐以求的想法。随着计算机越来越向便携化方向发展,随着计算环境的日趋复杂化,人们越来越迫切要求摆脱键盘的束缚而代之以语音输入这样便于使用的、自然的、人性化的输入方式。尤其是汉语,它的汉字输入一直是计算机应用普及的障碍,因此,利用汉语语音进行人机交互是一个极其重要的研究课题。它正在直接与办公、交通、金融、公安、商业、旅游等行业的语音咨询与管理,工业生产部门的语声控制,电话、电信系统的自动拨号、辅助控制与查询,以及医疗卫生和福利事业的生活支援系统等各种实际应用领域相接轨,并且有望成为下一代操作系统和应用程序的用户界面了。
;前端处??包括语音的录入、处理、特征值的提取
后端是个夸数据库的搜索过程, 分为训练和识别
训练是对所建的模型进行评估、匹配、优化, 获得模型参数
识别是一个专用的搜索数据库
;获取前端数值后, 有声学模型、一个语言模型和一个字典, 声学模型表示一种语言的发音声音, 可以通过训练来识别特定用户的语音模型和发音环境的特征, 语言模型是对语料库单词规则化的概率模型。字典列出了大量的单词及发音规则。总体上说,语音识别是一个模式识别匹配的过程。在这个过程中,计算机首先要根据人的语音特点建立语音模型, 对输入的语音信号进行分析,并抽取所需的特征,在此基础上建立语音识别所需的模板。然后,在识别过程中,计算机根据语音识别的整体模型,将计算机中已经存有的语音模板与输入语音信号的特征进行比较, 并根据一定的搜索和匹配策略找出一系列最优的与输入语音匹配的模板。最后通过查表和判决算法给出识别结果。显然,识别结果与语音特征的选择、语音模型和语言模型的好坏、模板是否准确等都有直接的关系。; 语音去噪技术是语音信号处理的一个重要分支,它在解决噪声污染、改进语音质量、提高语音可懂度等方面发挥着越来越重要的作用。当噪声与语音的频谱相似时,传统的单纯时域或频域处理往往无法达到很好的效果。小波变换是一种多尺度的信号分析方法,是分析非平稳信号的有力工具。它克服了短时傅里叶变换固定分辨率的弱点,既可以分析信号的概貌,又可以分析信号的细节。利用小波变换实现信号去噪,具有很好的效果。小波阈值去噪方法是实现最简单、计算量最小的一种方法,因而得到了最广泛的应用;第7页/共32页; 设ψ(t)∈L2(R)(L2(R)表示平方可积的实数空间,即能量有限的信号空间), 其傅立叶变换为ψ(ω)。当ψ(ω)满足允许条件:;对于连续的情况,小波序列为; 小波去噪方法大致可分为三类, 第一类是基于小波变换模极大值原理进行去噪; 第二类是对含噪声信号作小波变换之后,计算相邻尺度间小波系数的相关性,根据相关性区别小波系数的类型; 第三类是阈值去噪。阈值去噪即对小波系数设置阈值, 在众多小波系数中, 把绝对值较小的系数置为零,而让绝对值较大的系数保留或收缩, 然后对阈值处理后的系数进行小波逆变换,直接进行信号重构, 即可达到去噪的目的。
小波阈值去噪的主要理论依据为:信号在小波域内其能量主要集中在有限的几个系数中, 而噪声的能量却分布于整个小波域内。因此经小波分解后, 信号的小波变换系数要大于噪声的小波变换系数。于是可以找到一个合适的数作为阈值,当小波系数小于该阈值时, 认为这时的小波系数主要是由噪声引起的;当小波系数大于该阈值时, 则认为其主要是由信号引起的。选择一个合适的阈值, 对小波系数进行阈值处理, 就可以达到去除噪声而保留有用信号的目的。
; 实验中通过改进matlab系统函数ddencmp求解得阈值,并对阈值进行了一定修改,由于实验中阈值很小,在经过多次比较后,决定把已经求得的阈值thr+0.3作为重建小波的阈值。; 语音信号的端点识别是语音处理和语音识别的基础,然而在噪声环境下识别语音信号的端点往往比较困难的。我们采用的是经典的双门限检测法;为了区分噪音和语音,很直观的一种方法是用信号的幅度作为特征,只要设定一个门限,当信号的幅度超过该门限的时候,就认为语音开始,当幅度降低到门限以下就认为语音结束。
实际上,一般我们是使用短时能量的概念来描述语音信号的幅度的。对于输入的语音信号x(n),其中n为采样点,首先进行分帧的操作,将语音信号分成20~30毫秒一段,相邻的两帧之间有10~20毫秒的交叠。具体的帧长和帧移随采样频率不同而不同。
;对于第i帧,第n个样本,他与原始语音信号的关系为:
;尽管不能用短时能量可靠地区分清音和静音,但是还是可以发现在静音段信号的波形变化相对比较缓慢,而在清音段,由于口腔空气摩擦的效果,所造成
您可能关注的文档
最近下载
- 2025年中国邮政集团有限公司吉林省分公司校园招聘笔试模拟试题及完整答案详解.docx VIP
- 2024年《汽轮机本体检修》职业技能鉴定知识考试必备题库及答案(共190题).docx VIP
- (名师原创)《我能行》主题班会.ppt VIP
- 2022年初中物理培优(竞赛)及高中自主招生专题训练:第02章声现象(含解析).pdf VIP
- 三式簿记和收益动量 (美)伊尻雄治著娄尔行译.pdf VIP
- 华荣QJZ-2×□SF煤矿风机用隔爆兼本质安全型双电源真空电磁起动器.doc
- 《嗨,你好》幼儿园小班课程PPT课件.pptx VIP
- 2025年中国邮政集团有限公司吉林省分公司校园招聘笔试模拟试题及答案解析.docx VIP
- 可穿戴设备在睡眠数据采集中的应用.pptx VIP
- AI人工智能软件使用课件.pptx VIP
文档评论(0)