- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
3第3章 话音编码.ppt
第3章 话音编码 3.1.1 话音波形的特性 1.浊音(voiced sounds): 准周期脉冲(quasi-periodic pulses) : 在声门打开然后关闭时中断肺部到声道的气流所产生的脉冲。声门打开和关闭的速率呈现为音节(pitch)的大小,它的速率可通过改变声道的形状和空气的压力来调整。浊音表现出在音节上有高度的周期性,其值在2~20 ms(??)之间,这个周期性称为长期周期性(long-term periodicity)。 图3-01 浊音段的波形举例 图3-02 浊音段的功率普密度举例 2. 清音(unvoiced sounds) 由不稳定气流激励所产生的,这种气流是在声门处在打开状态下强制空气在声道里高速收缩产生的。 图3-04 清音段的功率谱密度举例 3. 爆破音 (plosive sounds): 是在声道关闭之后产生的压缩空气然后突然打开声道所发出的音。 3.1.2 三种话音编译码器 话音编译码器分成以下三种类型: 波形编译码器(waveform codecs): 话音质量高,但数据率也很高 音源编译码器(source codecs): 数据率很低,产生的合成话音的音质差 混合编译码器(hybrid codecs): 数据率和音质介于它们之间 图3-05 普通编译码器的音质与数据率 1. 波形编译码器 脉冲编码调制(pulse code modulation,PCM): 典型的窄带话音带宽限制在4 kHz,采样频率是8 kHz。 如果要获得高一点的音质,样本精度要用12位,它的数据率就等于96 kb/s,这个数据率可以使用非线性量化来降低。如,在北美的压扩(companding)标准是μ律(μ-law),在欧洲的压扩标准是A律(A-law)。 优点: 编译码器简单,延迟时间短,音质高。 不足之处: 数据速率比较高,对传输通道的错误比较敏感。 使用近似于对数的对数量化器(logarithmic quantizer),使用它产生的样本精度为8位,它的数据率为64 kb/s时,重构的话音信号几乎与原始的话音信号没有什么差别。 预测技术: 企图从过去的样本来预测下一个样本的值。 差分脉冲编码调制(differential pulse code modulation,DPCM) 对预测的样本值与原始的样本值之差进行编码。 自适应差分脉冲编码调制(adaptive differential PCM,ADPCM) 可以改进DPCM 编译码器对幅度急剧变化的输入信号会产生比较大的噪声。 时域法(time domain approach)TDA: 在时域里的编译码方法; 频域法(frequency domain approach)FDA:如, 子带编码(sub-band coding,SBC):输入的话音信号被分成好几个频带(即子带),变换到每个子带中的话音信号都进行独立编码,例如使用ADPCM编码器编码,在接收端,每个子带中的信号单独解码之后重新组合,然后产生重构话音信号。 自适应变换编码(adaptive transform coding,ATC):这种方法使用快速变换(例如离散余弦变换)把话音信号分成许许多多的频带,用来表示每个变换系数的位数取决于话音谱的性质,获得的数据率可低到16 kb/s 2. 音源编译码器 从话音波形信号中提取生成话音的参数,使用这些参数通过话音生成模型重构出话音。 声码器(vocoder): 针对话音的音源编译码器叫做 时变滤波器(time-varying filter): 在话音生成模型中,声道被等效成一个随时间变化的滤波器,叫做它由白噪声—无声话音段激励,或者由脉冲串——有声话音段激励。 3. 混合编译码 可以填补波形编译码和音源编译码之间的间隔 如:时域合成-分析(analysis-by-synthesis,AbS)编译码器 ,使用的声道线性预测滤波器模型与线性预测编码(linear predictive coding,LPC) ,使用产生的波形尽可能接近于原始话音的波形激励信号。 AbS编译码器的一般结构如图3-06所示。 (a) 编码器 (b) 译码器 MPE,RPE和CELP编译码器之间的差别: 在于所使用的激励信号的表示方法 在MPE(multi-pulse excited)中,对每帧话音所用的激励信号u(n)是固定数目的脉冲。 RPE(regular-pulse excited)编译码器使用固定间隔的脉冲,而脉冲的数目则比MPE使用的数目多,产生比MPE音质高一些的重构话音。 CELP(code excited linear predictive)使用的激励信号是量化矢量。激励信号由一个矢
您可能关注的文档
最近下载
- 《客户服务与管理》教案 第5课 学会使用即时通信工具.pdf VIP
- 民爆信息系统网路服务平台.pptx VIP
- 《QCNPC41-2001-防喷器判废技术条件》.pdf VIP
- 《客户服务与管理》(李清文)718-1教案 第2课 熟悉客户服务人员的综合素质要求.docx VIP
- 《客户服务与管理》(李清文)718-1教案 第3课 学会使用电话服务工具.docx VIP
- 3《峨日朵雪峰之侧》同步练习(含答案)统编版高中语文必修上册.docx VIP
- 第2课 让美德照亮幸福人生.pptx VIP
- 《峨日朵雪峰之侧》同步练习 统编版高中语文必修上册.docx VIP
- 海马普力马PREEMA 1.8L、1.6升 电路图07-发动机和变速箱控制.pdf VIP
- 《客户服务与管理》教案 第1课 初识客户服务与管理.docx
文档评论(0)