基于MatlabGuide藏语语音参数提取平台设计与实现.docVIP

基于MatlabGuide藏语语音参数提取平台设计与实现.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于MatlabGuide藏语语音参数提取平台设计与实现

基于MatlabGuide藏语语音参数提取平台设计与实现   摘要:目前,藏语语音参数提取相关研究相对较少,藏语语音处理过程中的重要环节是对藏语语音中的参数提取,其准确性直接影响到系统的性能。语音信号的特征参数主要指的是语音信号的基音频率和共振峰频率。基于MATLAB GUI创建一个平台将语音信号提取、预处理、分窗加帧可提高系统辨认度,让其准确性增加从而更好地提高系统的性能。   关键词:藏语语音;基音频率;MATLAN GUI   中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2017)34-0212-03   Abstract:At present, there are relatively few researches on the extraction of Tibetan speech parameters, and the extraction of Tibetan speech parameters is an important part in the process of Tibetan speech processing, and its accuracy directly affects the performance of the system. The characteristic parameters of speech signal are the pitch frequency and formant frequency. Based on the MATLAB GUI to create a platform to voice signal extraction, pretreatment, window frame can increase the system identification, so that the accuracy of the system to improve the performance of the better.   Key words: Tibetan speech; base tone frequency; MATLAN GUI   语音特征参数是人说话识别系统的关键组成部分,直接影响了系统的性能。藏语语音信号是冗余度相对较高的不稳定信号,将其特征参数提取并加以处理可以减少语音识别时所要处理的数据量,尽量能够完整、准确地表达语音信号。语音信号的特征参数主要指的是语音信号的基音频率和共振峰频率。基音检测作为藏语语音处理的关键环节直接影响整个语音处理系统的性能,基音检测是根据浊音语音的周期性进行周期或频率估算[1]。国内的藏语语音方面一般都在MFCC参数提取的理论基础上进行运算与提取[2],本文运用MATLAB Guide藏语语音参数提取平台的设计以及实现还是比较具有创新和实用的。   1 语音提取与函数处理   1.1 语音提取   藏语语音中浊音信号具有明显的周期性,所以用Matlab wavread函数将语音中浊音部分提取出来。   1.2语音预处理[3-4]   语音信号的预处理中的预加重,主要是为了实现对语音的主要高频部分进行加重和减小口唇辐射的一些影响,可以提高语音高频部分的分辨率。大部分通过传递函数为[H(Z)=1-az-1]一阶FIR高通数字滤波器来完成预加重,其中a是预加重的系数,0.9  1.3 分帧加窗[5]   进行了预加重数字滤波之后,信号就要进行加窗分帧的处理,因语音信号具有短时平稳性的特点(10-30ms内可以认为语音信号近乎不变),所以就可以把语音信号分为一个一个的短段来进行处理,这就是分帧,语音信号的分帧可以采用对可移动的一定长度的窗口用加权的方法来实现的。大多数每秒的??数约为33~100帧,因情况而定。一般的分帧方法是交叠分段,前一帧和后一帧的交叠部分称作帧移,帧移与帧长的比值大致为0~0.5。   汉明窗的时域与频域波形,窗长N=61,如图2所示。   2 MATLAB GUIDE界面设计[6-9]   Matlab Guide是使用者与计算机程序之间的交互方式,是使用者与计算机进行信息交流的方式。通过GUIDE界面使用者不需要输入命令,也不需要了解其内部是如何运行的。计算机在屏幕中显示图形和文本,而使用者可以通过输入设备与计算机通信,用户界面的功能是根据使用者来具体设定的。图形用户界面或GUI中包含多个图形对象例如图像窗口、图轴、菜单、按钮、文本框等组成的用户界面,使用者点击具体的对象,使其该功能被激活使用。Matlab guide既可以嵌入已有的仿真程序,又能把仿真之后的图形化的结果以人机交互的动态形式直观呈现出来,对于熟练使用MATLAB而又不想编写大量VC代

文档评论(0)

317960162 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档