- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于小波变换语音信号可视化研究
基于小波变换语音信号可视化研究
(东北大学 信息科学与工程学院, 沈阳 110004)
??
摘 要:给出了一种新的语音信号的可视化方法,利用基于小波变换的时频分析方法来模拟基底膜带通滤波器的特性,克服了SFT(短时傅里叶变换)分析对高、低频段具有相同的时间分辨率和频率分辨率的缺点。对经过小波变换滤波后的语音信号进行特征编码形成语音的组合特征,将该组合特征作为一个新的特征量来表示语音信息,并将这种特征用简单的图形表示出来。利用聋哑人自身的大脑来识别语音,达到训练其口语的目的。
?す丶?词:语音可视化;小波变换; 组合特征
?ぶ型挤掷嗪牛?TP391.42 文献标志码:A
文章编号:1001?B3695(2009)01?B0094?B03
??
Speech visualization based on wavelet transform
WANG Xu, XUE Lifang, YANG Dan, HAN Zhiyan
??
(College of Information Science Engineering, Northeastern University, Shenyang 110004, China)
??
Abstract:This paper described a new speech visualization method that created readable patterns by integrating combined feature into a single image. The system made use of timefrequency analysis based on wavelet transform to simulate the bandpass filter property of basilar membrane. The method remedied the defect that short fourier transform(SFT) had the same timeresolution and frequencyresolution to different frequency ranges. The auditory feature was displayed on the CRT by plot patterns and the deaf could utilize their own brain to identify different speech for training their oral ability effectively. Firstly, speech signal underwent a series of preprocessing course. Secondly, made use of wavelet transform to process timefrequency analysis for speech signal and extracted the feature value for speech visualization. Then calculated that the feature value lay in which place in full array and obtained the combined feature value. Finally, utilized plot display algorithm to generate a speech plot.
??Key words:speech visualization; wavelet transform; combined feature
?お?
语音信息的传递是人们相互交流最方便、最自然的手段。一部分聋哑人不能说话是因为他们的听觉器官遭到损坏,不能将语音信息采集到大脑,但发音器官是完好的。这种情况下的聋哑人,如果辅助于一些视觉训练系统,经过一段时间的专门训练是可以学会说话并与健全人进行交流的。对这种将语音信息转换为可以用视觉识别图像的辅助聋哑人语音训练系统自20世纪60年代中期以来在国内外都有很多研究[1,2]。这些方法主要分为三种:??
a)系统向学习者提供声音的静止或动态图像来诱导学习者发音,但并不对学习者的发音进行分析和评价,这种系统多采用数据库来组织语音图像数据[3,4]。??
b)系统通过麦克风、摄像头等感知器来获取学习者发音时的语音和其他信息,通过分析后在屏幕上反馈并与正确发音进行比较(如显示语音的响度、基
文档评论(0)