- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
dsp语音钥匙汇编
DSP课程设计——基于DSP的语音钥匙
PAGE \* MERGEFORMAT 30
DSP课程设计——基于DSP的语音钥匙
PAGE \* MERGEFORMAT 1
DSP课程实验报告
——基于DSP的语音钥匙
学 院: 电子信息工程学院
指导教师: 高海林老师
学 生: 樊坦容 王 旭
北京交通大学电工电子教学基地
2014年7月24日
设计任务
语音信号处理是利用数字信号处理技术对语音信号进行处理的一门学科,其核心技术包括语音合成、语音识别、语音测评等,是现代人机交互的重要方式之一,具有广泛的应用前景。近年来随着互联网和通信的发展,信息检索也呈现多样化,如文字检索、语音检索和基于内容的图像检索,其中语音检索将成为跨领域资源整合的纽带,而语音检索的关键在于进行语音匹配与识别。
(1)基础要求:
利用Matlab将采集到的一段语音进行仿真处理,实现基于语音相关匹配的较为简单的语音钥匙的功能。在CCS编译环境下利用C语言编写语音钥匙程序,并在BJTUDSP5502实验系统平台上实现。若语音钥匙开启,将指示灯D1进行1Hz闪烁(慢闪),并进行相应的语音提示。未开启,将指示灯D1进行3Hz闪烁(快闪),并进行相应的语音提示。
(2)发挥部分:
利用Matlab将采集到的一段语音进行仿真处理,实现基于语音特征值匹配的较为复杂的语音钥匙的功能。此语音钥匙安全性更高。在CCS编译环境下利用C语言编写语音钥匙程序,并在BJTUDSP5502实验系统平台上实现。若语音钥匙开启,将指示灯D1进行1Hz闪烁(慢闪),并进行相应的语音提示。未开启,将指示灯D1进行3Hz闪烁(快闪),并进行相应的语音提示。
设计内容
(1)理解语音信号的基本特征,学会利用Matlab对语音信号进行处理的基本方法与流程;
(2)学会利用Matlab对语音信号的预处理的方法和去噪的方法、信号相关算法仿真;
(3)掌握利用CCS编程环境编写语音信号处理算法(C代码),并在BJTUDSP5502实验系统上实现;
(4)设计合理的结果测试方式和方法,验证所设计系统的正确性;
(5)按照给定的模板撰写实验报告;
设计方案
主要流程图
信号
去噪
端点检测(VAD)
特征值提取
DTW算法
相关检测
基本原理
端点检测
语音信号一般可分为无声段、清音段和浊音段。无声段是背景噪声段,平均能量最低。浊音段为声带振动发出对应的语音信号段,平均能量最高。清音段为空气在口腔中的摩擦、冲击或爆破而发出的语音信号段,平均能量居于两者之间。采用基于能量的算法来检测浊音通常是可行也是可靠的。但对清音而言,除非信号具有极高的信噪比,否则,采用能量算法从背景噪声中鉴别出清音就不够可靠了。此时,需要用到语音号的另一重要特征,即过零率:一定时间内信号穿越零电平的次数。经验表明,通常清音段过零率最大,无声段的过零率的变化范围较大。可见,振幅特征适合检测浊音,过零率适合检测清音,为了同时检测两者,一般综合利用两种特征。
实际处理中,由于语音信号是一种非平稳信号,一般对数字化语音进行分帧处理,并认为在一帧内它是平稳的。一帧内的信号能量值和过零次数被称为短时能量和过零率。
检测过程:将短时能量与给定能量门限G1相比,若大于它并能在一定时间内达到门限G2并维持给定帧数,则认为是语音起点,否则向下找。判定起点后,将短时能量与给定门限G3比较,当小于它并能在一定时间内降到门限G4并维持给定帧数,认为是终点,否则向下找。
端点检测可以采用上面描述的分别用短时能量和过零率与门限比较的双门限算法,也可以把短时能量和过零率两者的乘积(能频积)作为检测参数,此时只需进行单一门限比较。
特征值提取
声学特征的提取既是一个信息大幅度压缩的过程,也是一个信号解卷过程,目的是使模式划分器能更好地划分。由于语音信号的时变特性,特征提取必须在一小段语音信号上进行,也即进行短时分析。这一段被认为是平稳的分析区间称之为帧,帧与帧之间的偏移通常取帧长的1/2或1/3。通常要对信号进行预加重以提升高频,对信号加窗以避免短时语音段边缘的影响。常用的一些声学特征有:
线性预测系数LPC:线性预测分析从人的发声机理入手,通过对声道的短管级联模型的研究,认为系统的传递函数符合全极点数字滤波器的形式,从而n时刻的信号可以用前若干时刻的信号的线性组合来估计。通过使实际语音的采样值和线性预测采样值之间达到均方差
最小LMS,即可得到线性预测系数LPC。对LPC的计算方法有自相关法(德宾Durbin法)、协方差法、格型法等等。计算上的快速有效保证了这一声学特征的广泛使用。与LPC这种预测参数模型类似的声学特征还有线谱对LSP
原创力文档


文档评论(0)