- 3
- 0
- 约6.47千字
- 约 4页
- 2017-08-10 发布于安徽
- 举报
局域以太网实时音频交互中延迟平衡算法的设计与实现
许史飞 活利华 谈正
西安交通大学信息工器研究所 710049
摘要:在局蛾吐太网中实现实时音颠交互系统时,由于咀太网和系统的固有特性,音颠流的传输
将出现延迟粹动,影响膏顿流的最后回放致秉.本文探讨了延迟抖动的特点t提出了动态白适应延迟
平衡算法,较好地实现了音蒗漉的平滑播放和较高的实时性.
美键词: 延逞抖动.琏迟平钎.实时娃
1.引言
一个典型的基于局域以太网的音频实时交互系统中,将罾颜流从一个端点接输到另一个
端点时一般会采用下面机制:源端采集尸伽音频。将音频流压缩成包,再通过LtⅣ将音频包
一传输到接收端。接收端接收到音频包。解压播放.在整个传输过程中,由于以太网的传输机制.
不可避免地会出现网络传输延迟,尤其在跨络负载较大时,延迟增大且抖动加剧,另外加上两
端处理的延迟,使最后到达接收端的音频包出现时序错位,如果接收端不对延迟抖动避行处
理,在收到一个音频包后立邸播放,声音籍会失真.因此在接收端必须设置一个缓冲区,将音
频流临时存储在缓冲区中.在等待~段时间居再摇放. 速个等待时间称为延迟倜穆.在实时
系统申,这个延迟偏移量的大小直接决定这个系统的实时睦能.磊统对实时缝的要求.和音额流
必须尽可能平滑回放是一对相互抑制的矛盾:如果延迟倔移量很大.一股可以保证音频的平滑
回放,但实时性太差:如果太小,音频回放质量可能会大大将低.如何寻求实时性和音频回放
质量之间的乎衡点是解决问题的核心.本文分析了延迟及其抖动,针对其特点,提出了一种动
态的自适应延迟平衡算法,较好地解决了实时性和平滑播放之间的矛詹.
2.延迟和抖动
系统网络传输延迟通常有不同的定义,本文中,我们认为音频流从源端到接收端的延迟
由下面几个部分组成.如图1所示:
PCM码
包采集 ;. & 龟 生 l!l!二!I.二!.
存取延芝 :: i 臣 垦生 I!l二!ll!:!.
等待解竺 i;& 莹生 :I!!!l:l!三
圈l:延迟辩动
A.源端从连续音频源采集PcM码流,压缩成为音频包时经历的延迟矗,这个延迟取
决于源端每个音额包的大小.为了接高窭时忡.簟个喜黼自由诧J璺百f鳃爪
222 1,::::,耋墼氅堡量墼些堡兰鳖鬯篓董呈坠一
B. 音频包在薄端等待被发送时的延迟d2,称为存取延迟,这个延迟时间较难以预测,
尤其在以太网负载较大时,变化范围很大.音频包在网络上传输时不可避免有物理
抖动,相对于其他部分.这个值要小得多,可以忽略.
c. 音频包在接收端等待接收端处理、将音频包解包,还原为PCIvi码流的延迟以.
这个延迟一般也较小.
一个音频包总的延迟占=d+或4-d,.
谩在某一时间段r内的最大延迟为玩。=Ⅳ敞吖磊,以,…,4j,其中疋为第j个音频包
的息延迟,郎从源端删码流到接收端户laM码流的延迟.这个最大延迟占。表示当前时间段
内的系统传输质量.由于系统和月络的延迟在不断变化,延迟量参不斯抖动,即其大小在不断
变化,接收端将发现接收到的音频流成突发性变化.如果能够保证有序接收音频包.由于总延
迟保持在一定范围内,莱一时间段内若只接收到较少的音频流,必将鼹随着出现在下一个时间
段内会有一个流的高蛙.反之亦然,邸音频接收速率也呈抖动振荡性变化,其均值应为当前FC.M
码流毕RP·
3.延迟偏移平衡
人耳的骄搓行为可珏睫式化为一个徽分嚣,音颡流很小的时阈错位鄂将引起严重的声罾
失真.接收鞴为了能够平衡连续地播放声音,必须设置一个输入缓冲遂,将PGhI玛流暂时存
储在这个缓冲区中,等待一定时问后再开始措放.这个等待时闻称为短迟偏穆Ds,缓冲区称
为廷迟值移缓冲区.
延迟偏移量D.7的大小取决于整个系统的延迟,由圈1.设己知当前系统的最大延迟
占。,接收端在某一时问段r中接收到闩@f码流量R珥一定满足下到条件:
原创力文档

文档评论(0)