- 1、本文档共40页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
自相关法 3.混合编码 介于波形编码和参数编码的一种编码。即在参数编码的基础上引入了波形编码的一些特征。 波形编码+参数编码 可在4----16kbit/s范围内达到良好的语音质量 清/浊转换 声道模拟 滤波器 基音周期 脉冲序列 发生器 随机噪声 发生器 输出语音s(n) LPC系数 增益 ? x(n) u(n) LPC 语音合成图 CELP 语音合成示意图 AMR 发送端 接收端 解码器 * * 第一节课 数字语音编码 多媒体数字信号编解码器 COder 和 DECoder 作用:对视频、音频信号进行压缩和解压 IP网络语音处理过程 PCM PCM的产生 脉冲编码调制—将模拟调制信号的采样值变换为脉冲码组。PCM编码包括如下三个过程。 抽样:将模拟信号转换为时间离散的样本脉冲序列。 量化:将离散时间连续幅度的抽样信号转换成为离散时间离散幅度的数字信号。 编码:用一定位数的脉冲码组表示量化采样值。 抽样 模拟声音在时间上是连续的,而数字音频是一个数字序列,在时间上只能是断续的。因此当把模拟声音变成数字声音时,需要每隔一个时间间隔在模拟声音波形上取一个幅度值,称之为采样(抽样),采样的时间间隔称为采样周期(倒数为采用频率) 抽样 量化 在数字音频技术中,把采样得到的表示声音强弱的模拟电压用数字表示。模拟电压的幅值仍然是连续的,而用数字表示音频幅度时,只能把无穷多个电压幅度用有限个数字表示,即把某一幅度范围内的电压用一个数字表示,这称之为量化 量化和编码 为什么要使用CODEC? *采样频率是指单位时间内的采样次数。 *奈奎斯特(Harry Nyquist)采样理论:只要采样频率f(1/T)高于输入信号最高频率的两倍,则经过采样后的采样信号能够包含原模拟信号的全部信息,且经过反变换和低通滤波后可不失真地恢复原模拟信号。 *电话话音的信号频率约为3.4 kHz,采样频率就选为8 kHz。 以8kHz的频率对语音信号进行采样。PCM中每个采样点用16位来表示,那么一秒钟要传输: 16 × 8000 = 128000(b) 也就是要达到128kps的传输速率,才可以传送一路语音信号。因此必须对语音信号进行压缩。语音压缩就是要去除传输信号的冗余信息。 语音压缩——去除语音信号样本的冗余信息 客观冗余 -- 信号本身特征 (1)语音信号样本间的相关性很强(8kHz时两点相关0.85) (2)浊音段的准周期性 (3)声道的形状及其变化比较慢 (4)静止系数(语音间隔,有静音期) 主观冗余--人的听觉特性 听觉掩蔽特性 听不到或不灵敏的语音分量视为冗余 语音编码分类 根据编码器的实现机理,分成三大类 波形编码 参数编码 混合编码 1、波形编码 从语音信号的波形出发,对波形的抽样值、预测值、预测误差进行编码,它以重建语音波形为目的,力图使重建波形接近原信号波形。 特点:利用抽样定理,恢复原始信号的波形 优点:适应能力强,重建语音质量好 缺点:编码速率较高 类型: PCM, 自适应增量调制 (ADM), 自适应差分编码调制(ADPCM), 自适应预测编码APC 速率通常在16------64kbit/s范围 非均匀量化进行压缩 均匀量化与非均匀量化 非均匀量化 对小信号采用小的量化间隔,对大信号采用大的量化间隔,这样可以用较少的位数编码。 对大信号来说,虽然绝对量化误差较大,但是因为:(1)大信号出现的机会不多,(2)信噪比(相对误差)与小信号是一致的,所以对总的话音质量影响不大。 非均匀量化也是一种压缩。(如PCMU和PCMA,每个样本的精度为8位,输出的数据率为64 kb/s ) 2.参数编码 提取语音的一些特征信息进行编码,在收端利用这些特征参数合成语音。 优点:编码速率低。 缺点:语音的音质和自然度较差,很难辨别说话人。(有一定的可懂度) 类型:LPC线性预测编码 速率通常是在4.8kbit/s以下 话音的形成原理 肺中的空气受到挤压形成气流,气流通过声门(声带)沿着声道(由咽、喉、口腔等组成)释放出去,就形成了话音。 气流、声门可以等效为一个激励源,声道可以等效为一个时变滤波器(共振峰)。 话音信号具有很强的相关性(长期相关、短期相关)。 等效为激励源+声道+喇叭口 话音的分类 浊音(voiced sounds):声道打开,声带在先打开后关闭,气流经过使声带要发生张驰振动,变为准周期振动气流。浊音的激励源被等效为准周期的脉冲信号。 清音(unvoiced sounds):声带不振动,而在某处保持收缩,气流在声道里收缩后高速通过产生湍流,
您可能关注的文档
- 数据通信第六章精品.ppt
- 数据通信第一章概述(福大电气)精品.ppt
- 数据通信基础知识培训——路由协议精品.ppt
- 数据通信及计算机网络体系结构精品.ppt
- 数据通信竞赛试题库精品.doc
- 数据通信课件第八章精品.ppt
- 数据通信课件第三章(7终)完成2精品.ppt
- 数据通信与计算机网络习题答案(第2版)精品.doc
- 数据通信与网络技术2精品.ppt
- 数据通信与网络技术6精品.ppt
- 基于人工智能教育平台的移动应用开发,探讨跨平台兼容性影响因素及优化策略教学研究课题报告.docx
- 高中生物实验:城市热岛效应对城市生态系统服务功能的影响机制教学研究课题报告.docx
- 信息技术行业信息安全法律法规研究及政策建议教学研究课题报告.docx
- 人工智能视角下区域教育评价改革:利益相关者互动与政策支持研究教学研究课题报告.docx
- 6 《垃圾填埋场渗滤液处理与土地资源化利用研究》教学研究课题报告.docx
- 小学音乐与美术教师跨学科协作模式构建:人工智能技术助力教学创新教学研究课题报告.docx
- 《航空航天3D打印技术对航空器装配工艺的创新与效率提升》教学研究课题报告.docx
- 教育扶贫精准化策略研究:人工智能技术在区域教育中的应用与创新教学研究课题报告.docx
- 《区块链技术在电子政务电子档案管理中的数据完整性保障与优化》教学研究课题报告.docx
- 《中医护理情志疗法对癌症患者心理状态和生活质量提升的长期追踪研究》教学研究课题报告.docx
文档评论(0)