语音的特征与声码器的设计.pdfVIP

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
在有线通信系统中用得最多的source coding 技术是PCM (pulse code modulation )技术,模拟语音被转换成64kbps 的比特流。有线 通信中用到的其它技术还包括 ADPCM (adaptive pulse code modulation)和DM (delta modulation )。上述的语音source coding 技 术也被称为“波形编码”技术,因为它们的目的是复制源信息的波形。 这就是计算机的调制解调器能够连接到电话线上的原因:之所以发送 端的调制解调器产生的波形上携带的信息能够稳定地被另一侧的接 收端的调制解调器所接收,是因为 PCM 只负责复制信号波形,并不 关心信号波形携带的信息是人的声音还是调制解调器的调制音频。 受带宽限制,PCM 技术不适合无线环境。传送64Kbps 的信息需 要超过 64Kbps 的无线带宽资源,这不是运营商能够负担的。无线通 信系统需要更加节省带宽的source coding 技术。声码器(vocoder ) 就是符合这个要求的解决方案。根据人的声音的特点,声码器能够用 更少的比特来代表和复制人的声音(参加图 1)。PCM 不但能对人的 声音编码,还能对音乐和调制解调器的音频信号编码;而声码器只能 对人的声音编码,因为它是专门为人的声音定制开发的。 图1 无线通信系统引入声码器的原因 声码器充分利用了人的声音的时间特征和频率特征。人的声音由 浊音(voiced sound )和清音(unvoiced sound )组成。准周期 (quasi-periodic )空气脉冲通过声道时产生了浊音(比如元音)。浊 音一般包含有一个有基本周期率的基础频率,这个基础频率也叫做音 调 (pitch)。湍流空气通过声道时产生清音(比如辅音),清音更象是 声道关闭和突然打开时产生的声学噪声。图2 说明了声音产生的基本 原则。 图2 声音的激发和产生 尽管人的声音随时间而变化,它的范围基本上是固定的,持续时 间大约是20 毫秒到40 毫秒,因此绝大多数声码器输出的帧的长度是 20 毫秒到40 毫秒。比如,IS-95 声码器输出的就是20 毫秒的帧。 声道可以用一个随时间变化的线性滤波器来模拟,即它的滤波响 应随时间而变化,这通过周期性地改变滤波系数而实现。这个滤波器 是典型的全极点滤波器,因为和既有极点又有零点的滤波器相比,全 极点滤波器对计算能力的要求比较低。因此这个模拟声道的滤波器可 以用1/T(z)来表示。如果用E(z)来表示excitation 信号,则声码器输出 的语音信号S(z)的范围是: S(z)= (1.1) 也可以写成: E(z) = S(z)T(z) (1.2) 一个全零点滤波器有时候也被称为分析滤波器(analysis filter ), 而(1.2)代表了语音分析的过程。而全极点滤波器1/T(z)也被称作合 成滤波器,它和excitation 信号E(z)一起来合成语音信号S(z),而(1.1) 也代表了语音合成的过程。这种类型的编码技术有时候也叫做分析— —合成编码。图3 描述了怎样在发射端分析声音和怎样在接收端合成 声音。声音编码器分析语音并产生 excitation 参数(比如浊音/清音 excitation )和20 毫秒范围内的滤波系数。excitation 参数和滤波系数 都是语音编码器的输出参数。在 IS-95 系统中,这些参数和系数是在 接收端和发射端之间通信交换的信息。接收端的语音解码器用这些参 数和系数构建excitation 源和合成滤波器,并输出和S(z)近似的Ŝ(z) 。 图3 人的声音的复制过程

您可能关注的文档

文档评论(0)

feiyang66 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档