语音信号采集和处理方法分析.docVIP

下载本文档

53
0
约3.56千字
约 8页
2018-07-05 发布于福建
举报
版权申诉

语音信号采集和处理方法分析.doc

1、本文档共8页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

语音信号采集和处理方法分析

语音信号采集和处理方法分析　　摘要：语音是人类传递信息的一种最主要、最有效、最方便的交流形式。语言是人类特有的交流方式，而声音又是人类比较常用的交流工具，是传递信息的主要手段，所以，语音信号是人们感情交流以及思想沟通的主要途径。目前，人们已经进入到了信息时代，利用一些现代先进的技术方法分析语音信号，加强对语音信号采集与处理的研究，使人们可以更加方便的传输、获取、存储以及使用相关的语音信号，对于加快社会的发展与进步有着非常重要的现实意义。　　关键词：语音信号；采集；处理　　对于语音信号的采集与处理一直就没有断过研究，不仅仅是因为其具有一定的实用性，还有一个非常重要的原因就是，其始终与信息科学中最前沿的学科有着紧密的联系，并且能够共同发展。语音信号的采集与处理是一门涉及范围比较广的综合性学科，其是以语音语言学以及数字信号处理为基础，并且与计算机技术、信息技术以及通信技术等均有紧密的联系。所以，加强对语音信号采集与处理方法的分析与研究，有助于促进社会的不断发展以及科学技术的不断进步。　　1 语音信号具有的特点　　通过对大量实际语音信号的分析，我们可以明显发现语音信号具有两大特点：一是从时域方面而言，语音信号具备“短时性”特点，也就是说，从总体上而言，语音信号的特点是随着时间的延续而发生不断改变的，但是在一段比较短的时间范围之内，语音信号还是可以保持不变的。通常情况下，在清音段表现出来的特点就是随机噪声，在浊音段表现出来的特点就是周期信号。二是从频域方面而言，语音信号频率主要集中的范围就是300-3400赫兹之间。通常情况下，就可以利用这一特点，采用带通滤波器将这一区间的语音信号频率提取出来，之后根据8千赫兹的采样频率对提取出来的语音信号开展相应的采样工作，这样就可以得到相对比较离散的语音信号。　　2 语音信号的采集　　将语音信号转变为数字信号，就一定要采集到语音信号，也就是要进行语音信号的采样与量化，进而得到在幅度以及时间上都是离散的数字信号。采样可以称之为抽样，是语音信号在时间上的离散过程，采样的时候一定要满足奈奎斯特定理，才可以对语音信号进行有效的采样。在语音信号采样的时候，一定要重视采样间隔的设定以及相关语音信号的混淆，也就是说，对语音信号的采集首先就要明确采样间隔。通常情况下，采样的频率越高，采样的点数就会越加密集，所得到的离散信号也就越加接近于原始的语音信号。但是采样的频率也不要太高，对于一些固定长度的语音信号，采集到太多的语音数据，可能会给计算机系统带来许多不必要的分析工作量以及占据过大的存储空间；如果限定了数据量，而采样的时间又太少，就会致使一些数据被排斥在外。采样的频率太低，采样点的间隔距离又太远，就会导致离散信号不足，无法反映原有语音信号的特征，进而无法复原语音信号，导致出现信号混乱的情况。根据相关的采样定理，可以将采样的频率设置为大于语音信号的2倍带宽，这样在采样的过程中就不会出现丢失信息的情况。量化就是对幅度进行离散，也就是将振动幅度用二进制量化的方式予以表现，其量化电平主要是根据级数进行改变的，实际振动的值是一种比较连续的物理量。完成语音信号的采集之后，就可以对其进行相关的处理。　　3 语音信号的处理　　语音信号处理可以简单称之为语音处理，是在数字信号处理以及语音学的基础之上建立的一门综合性比较强的学科，对其进行处理的目的就是获取一些语音参数，进而完成语音的传输或者存储，通过某种计算的处理，以此来实现某种用途的具体要求，比如：辨识说话人、人工合成语音、识别讲话内容等。其包含了四大部分，语音编码、语音识别、语音合成以及说话人识别。语音是由人类发音器官发出来的声音，并且具有一定的现实意义与社交作用，可以表达一部分特定的含义，这就是语音与自然界其它声音的根本区别所在。语音与其所表达的现实意义是互相依赖的统一体，从一方面而言，发音器官发出来的声音一定要带有一定的现实意义，并且与现实意义紧密的联系在一起，这样的声音表达才可以称之为语音；从另外一方面而言，现实意义的表达一定要借助声音的形式，才可以被人们感知以及接受，没有声音的表达，就不会有相应现实意义的体现。　　4 语音信号采集与处理的方法　　4.1 计算机系统中录音机程序　　计算机系统的附件中有一个录音机程序，其可以驱动声卡进行语音信号的采集、播放以及处理。对于语音信号的采集可以直接用麦克风录制人的语音，也可以利用人工输入数据线或者音频线将磁带或者电视中的语音信号采集输入到计算机当中，这样就可以根据输入文件的属性进行文件格式、位数以及采样频率等方面的设置，同时也可以根据实际需要对语音信号进行简单的处理，比如：加大或者减小音量、添加回音效果、加快或者减慢语音的速度以及声音反转等，其中加速或者减速完全可以实现变音的效果，反转可以实现声音文件加密