在PC平台上的语音信号采集和处理.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
101 科技资讯  科技资讯 SCIENCE  TECHNOLOGY INFORMATION 2008  NO.08 SCIENCE  TECHNOLOGY INFORMATION I T 技 术 1  基于PC机的信号采集系统 1.1系统设计关键问题 目前P c 机的外部扩展设备已经很齐全,w i n d o w s 一般带有的音频操作软件很全面,硬件方面只需一个可以将语音转换成电子信号的设备,比如麦克风。软件采用Matlab 高级程序设计语言设计。Matlab 是美国m a t h w o r k s 公司开发的“演算纸”式的程序设计语言,是一个跨平台的科学计算环境。它以其强大的计算和绘图功能、大量稳定可靠的算法库、简洁高效的编程语言以及庞大的用户群,成为数学计算工具方面事实上的标准。包括通信、信号处理、神经网络、自动控制等几乎所有的工程计算领域,M a t l a b 都有相应的软件工具箱。最新的M a t l a b 版本,不仅可以与C /C ++、V C 、V B 等高级语言混合编程、互相调用,还可以调用计算机硬件设备,是目前最为流行的软件之一。为制作基于M a t l a b 的信号采集系统提供了很好的条件。编程设计时要考虑以下3个关健问题:①录放音函数的选用。M a t l a b 中有两个函数可以用于实现录音功能。使用wavrecord 函数调用windows 音频设备进行录音,主要用于实时语音采集。调用格式为x=wavrecord(n,fs,ch,dtype,得到数字化的语音数据串,可直接作为M a t l a b 变量参与各种运算,式中n 为采样的点数,决定了录音长度;f s 为采样频率,默认值为11025H z ,还可根据系统要求自己选择合适的采样率;c h 为声道数,默认值为1,表示单声道,如果指定为2,则采样为双声道立体声数据;d t y p e 为采样数据的存储格式,用字符串指定,可以是‘double’、‘single’、‘intl6’、‘int8’,指定存储格式的同时也就规定了每个采样值量化的精度,i n t 8对应8位精度采样,其他都是l6位采样精度。使用Matlab 的wavread 函数也可以采集语音。不过w a v r e a d 函数只能读取计算机中已有的w a v 文件,也就是说,必须事先使用w i n d o w s 的录音机等设备把有关的语音资料录制并存储为w a v 文件。显然w a v r e a d 不能用于实时的语音采集处理系统,另外,语音采样的频率和精度不能改变。回放时也有两个函数可以选用。可以使用s o u n d 函数,调用格式为sound(x,fs,其中x 是采集到的数据序列,f s 是采集时使用的采样频率。也可选用另一个函数wavplay,不过wavplay 没有sound 适应性强,只能用于w i n d o w s 平台。②语音分帧技术。语音信号的存储和处理都是按帧进行的。语音信号是一种非平稳信号,进行时频分析及其他各种处理时一般要采用短时分析技术,即把长时间的语音数据串分成10~30m s 的短时帧。可以使用Matlab 的enframe 函数对采集的语音数据进行分帧。利用e n f r a m e 函数对采集的连续语音信号分帧时,可以同时选择添加哈明窗或矩形窗以满足频谱分析等信号处理的要求。调用格式为Y =e n f r a m e  (x ,N ,R ,即把序列x 分成若干个长为N 的帧,R 为相领帧移量,帧长减去帧移量即得相邻帧和重叠长度,得到的Y 是一个以N 为行的矩阵,总行数即总帧数决定于X 、N 、R 之间的大小关系。实际应用,N 由采样时间间隔和一帧持续的时间长决定;R 一般小于N 的一半,具体取值还要考虑窗的类型。③有无声的判决。有无声判决在采集 系统中作用非常大,它决定了系统开始采集存储与否,也是采集结束与否的依据,还可以为语音增强处理提供噪声源。判决标准的选择非常关键。短时帧能量是常用的数据之一,其运算简单但是难以区分清音与宽带噪声;过零率是另一个常用判决数据,过零率的特点是可以有效区分清音和噪音但运算复杂。采用短时帧能量和过零率双重标准可以增加有无声判决的准确性,同时也可提高程序运行效率。1.2音频信号的采集方法 在音频信号处理方面,下面介绍一种简单,实用,经济的适用于中低频的信号处理方法,如图1所示。 采集时将随时间变化的力、位移、时间变化的电压信号,并将其降压处理,其变化范围在一1—1V 之间以满足声卡的输人要求,然后就可以将两路信号直接连接到声卡的LINE IN 接口上,利用Matlab 环境下数据采集工具箱(Data Acquisition采集声音信号,为提高声音信号的质量,可对采样频率等属性进行必要的设置。在对声音进行录制过程

文档评论(0)

44422264 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档