数字语音处理解析.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数字语音处理在MATLAB上的降噪应用 摘要 语音信号处理包括语音通信、语音增强、语音合成、语音识别和说话人识别等方面。只有通过语音信号的数字处理,语音信号的好坏、语音识别率的高低,都取决于语音信号处理的好坏。因此,语音信号处理是一项非常有意义的研究课程。? 语音,即语言的声音,是语言符号系统的载体。它由人的发音器官发出,负载着一定的语言意义。语言依靠语音实现它的社会功能。语言是音义结合的符号系统,语言的声音和语言的意义是紧密联系着的,因此,语言虽是一种声音,但又与一般的声音有着本质的区别.语音是人们交流思想和进行社会活动的最基本手段,因此我们要对语音信号进行处理分析,优化人类通信交流。? 语言是人类持有的功能.声音是人类常用的工具,是相互传递信息的最主要的手段。语音信号是人们构成思想疏通和感情交流的最主要的途径,通过语音传递倍息是人类最重要、最有效、最常用和最方便的交换信息的形式。现在随着时代的发展,人类已开始进入了信息化时代,用现代手段研究语音信号,使人们能更加有效地产生、传输、存储、获取和应用语音信息,这对于促进社会的发展具有十分重要的意义。在本次实训中我设计的题目是:语音信号的数字处理。实训的设计是对语音信号的数字处理,通过对所采集的语音信号进行时域波形和频谱图分析,采用双线性变换法设计滤波器,语音信号通过对滤波器进行滤波,然后回放语音信号,并对其滤波前和滤波后的语音变化进行分析。现在社会衍生了很多现代的语音通信方式,手机语音、语音聊天软件以及语音小说等,涉及语音的方面几乎遍及了我们的大部分生活,和我们生活息息相关,因此语音信号处理是具有现实意义的研究课程。? 一、数字处理关键技术? 1.1语音编码技术? 语音信号的数字化,最简单的方法是对其直接进行模/?数转换;只要采样率足够高,量化每个样本的比特数足够多,则可以保证解码恢复的语音信号有很好的音质,不会丢失有用信息。? 对语音进行压缩编码的基本依据有两个:一个是从产生语音的物理机理和语言结构的性质来看,语音信号是强相关、弱平稳信号,有很高的冗余度。语音压缩的实质就是识别这些冗余度并设法去掉它们。语音编码的第二个依据是利用人类的听觉特性。首先语音编码利用人耳分辨率有限特性,不需要对语音样点幅度做精确表示,即语音信号对于人耳带有过多的信息,通过量化可以去除这些过多的信息,从而达到压缩的目的。其次,人类听觉有“掩蔽效应”的特点,即当两个响度不等的声音作用于人耳时,则响度较高的频率成分的存在会影响到对响度较低的频率成分的感受,使其变得不易察觉。目前常见的语音编码算法有线性预测编码、多脉冲激励线性预测编码、码激励线性预测编码、多带激励编码等。多脉冲激励线性预测编码算法采用了由多个不均匀间隔脉冲所组成的激励序列,此算法在10kbit/s?的低码率下能产生比较好的语音质量,但对高基音说话者来说,其性能通常会有所下降。码激励线性预测编码的算法是利用矢量化的码本,将激励序列编码。码本中的每一个存储的码字矢量(简称码矢量)?都可以代替余量信号作为可能的激励信号源。? 实践表明,码激励线性预测编码器在4.8-1610kbit/s?范围内可以获得质量相当高的合成语音,是最具有吸引力的语音压缩编码方式之一。多带激励语音编码将语音谱按基音谐波频率分成若干个频带,逐带分别判断是清音还是浊音,然后采用不同的激励信号源产生该带的合成信号,最后将各带相加,形成全带合成语音。多带激励语音编码是目前低速率语音编码较理想的方案,在2.4-4.skbit/s?的速率上能合成出比传统声码器好得多的语音。? 目前,语音压缩编码技术主要有两个努力方向:一个是中低速率的语音编码的实用化,及如何在使用过程中进一步减低编码速率和提高其抗干扰、抗噪声能力;另一个是如何进一步的降低其编码速率。目前比较好的算法还有正弦变换编码、混合激励线性预测编码、时频域插值编码、基音同步激励线性预测编码等,同时还要求引入新的分析技术,如非线性预测、多精度时频分析技术(包括子波变换技术)、高阶统计分析技术等。这些技术更能挖掘人耳听觉掩蔽等感知机理,更能以类似人耳的特性作语音的分析与合成,使语音编码系统更接近于人类听觉器官的处理方式工作,从而在低速率语音编码的研究上取得突破。 ? 1.2?纠错编码技术? 纠错编码技术的目的有两个:一是解决由信道噪声所产生的随机性差错,二是解决由脉冲干扰所引起的突发性差错。 RS?码纠错性能分析:RS?码是非二进制码,RS?码的码字取自GF(2m),也就是由0.1、α和α的各次幂组成。RS?码不仅能够纠单个随机错误,还可以纠突发错误。在GF(24)域中,(15,11)码可纠2?位错,(15,9)码可纠3?

文档评论(0)

三哥 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档