第3章音频信息处理技术祥解.ppt

  1. 1、本文档共212页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第3章音频信息处理技术祥解.ppt

* (1)静态延时偏差: 延时偏差的值是静态设置的, 可能基于延时分布的某个估计。 在这种情况下趋向于取一个相当高的值以减小在延时偏差后数据块到达的可能性, 这种技术对于那些在时间上性能稳定, 特别是那些传输延时并不依赖于所提供的负载的网络很有效。 相反, 对那些分组交换网(如共享LAN或IP网络)使用静态偏差技术后, 会导致在下载期间延时过长。 * (2)自适应延时偏差: 接收系统测量端到端之间的实际延时且采用相应的延时偏差, 对那些延时分布在忙和闲时变化很大的分组交换网来说, 这种技术比静态设置要好。 困难在于, 延时偏差不同的时间的转换。 这个变化应当尽量使听者不会注意到。 如果过分的延时, 使延时平衡缓存器变空了, 则数模转换器将不会得到任何数据, 这就会产生声音跳跃或停顿。 当这种情况发生时, 就称为出现缓冲区饿死。 这是数字音频播放系统设计的主要难点, 必须在缓冲器大小和长延时偏差间找平衡点。 * 3. 分组语音技术 传统的电话网以电路交换的方式传输语音, 需要的基本带宽为64 kb/s 要在基于IP的分组网络上传输语音, 必须对模拟的语音信号进行特殊的处理, 使信号适合在面向无连接的分组网络上传输, 这项技术称为分组语音技术 * 1) 分组语音技术简述 分组语音技术是指将语音信号转换为一定长度的数字化语音包, 采用存储转发的方法以包的形式进行交换和传输的技术。 电话技术通常需要64 kb/s以上的带宽, 而分组语音需要的带宽不到10 kb/s 网关将语音信号从传统的电话格式转换适用分组传输的格式, 然后通过网络将分组数据发送到目标网关 * 2) 处理流程 依次经过模拟信号、 数字信号、 语音包的处理过程 接收端对语音包进行相反的处理, 从而得到与输入端相同的语音信号 * (1) 发送端的处理流程。 首先, 把模拟信号转换为数字信号, 并对其进行进入缓冲器前的量化数据处理。 声卡和音频设备先对模拟语音信号进行8 bit或16 bit量化 然后再送入缓冲器。 许多低比特率的编码器对语音块(也被称为帧)进行编码 典型帧为10~30 ms 考虑到传输过程中的代价, 语音包通常由60 ms、 120 ms或240 ms长的语音数据组成。 * 其次, 把语音包按照特定的帧长进行编码。 大部分的编码器都有特定的帧尺寸, 若一个编码器使用15 ms的帧, 则把从第一级来的120 ms的包分成8帧, 并按顺序进行编码。 每个帧含120个语音样点(抽样频率为8 kHz)。 编码后, 将8个压缩的帧合成一个压缩的语音包送入网络处理器。 网络处理器为语音包添加包头、 时标和其他信息后通过网络传送到另一端点。 * (2) 接收端的处理流程。 首先, 网络提供一个可变长度的缓冲器, 用来调节网络产生的抖动。 缓冲器可容纳许多语音包, 用户可选择缓冲器的大小, 大的缓冲器能调节大的抖动, 但产生延迟较大, 小的缓冲器产生延迟较小, 但不能调节大的抖动。 其次, 解码器将经过编码的语音包解压缩后产生新的语音包。 也可按帧进行操作, 其长度完全和编码器的长度相同。 若帧长度为15 ms, 则120 ms的语音包被分成8帧, 然后被解码还原成120 ms的语音数据流送入解码缓冲器。 最后, 缓冲器中语音样点被播放驱动器取出进入声卡, 通过扬声器按预定的频率(例如8 kHz)播出 * 3) 分组语音的传输方案 分组语音传输网络可以基于IP、 帧中继或异步传输模式(ATM), 这些构成了传统的分组语音传输方案, 我们分别称为ATM语音(VoATM)、 帧中继语音(VoFR)、 IP语音(VoIP)。 VoATM(Voice overATM)是指在ATM网络上传递分组语音的技术。 ATM是利用固定长度(53个字节)信元中的48个字节来存放数据信息的, 因此, 通过ATM传输语音流要遵循ATM信元的结构规定 * VoFR (Voice overFrame Relay)是利用帧中继网络传输分组语音的技术。 帧中继论坛FRE.11已经建立了用于帧中继上的语音传输以及有关通话建立、 编码类型和分组格式的标准, 未来还将提供用于产品互操作性等方面的基本功能。 VoIP(Voice overIP)是利用IP网络进行语音通信的技术。 IP是无连接的, 在优先级、 资源预留、 分组拆分等领域的优势比较引人注目。 IP拥有强大的信令、 寻址和路由功能。 IP的另一优势在于它与当前众多的数据应用程序的集成, 使得IP网络应用无所不在。 * 4. 静噪抑制技术 静噪抑制技术 是指检测到通话过程或传真过程中的安静时段, 并在这些安静时段停止发送语音包 研究表明, 在一路全双工电话交谈中, 只有36%~40%的信号是活动的或有效的。 当一方在

文档评论(0)

love + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档