- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于视频教室音视频编码研究
基于视频教室音视频编码研究
摘要:文章分别从视频教室的音频编码和视频编码的角度展开,介绍了各类相关的技术,并引出了系统所采用的先进的音视频编码技术。最后,说明了系统采用的音视频流控技术的几个优点。
关键词:视频教室;音视频;H.264
中图分类号:TP309 文献标识码:A 文章编号:1009-3044(2009)15-4017-02
Reacher Audio-video Cording Based on Video-classroom
WU Ai-lan1, LOU Jian-lie2
(1.Zhejiang highway technolgy collage,Hangzhou,310014,China;2.Zhejiang technology institute of Economy,Hangzhou 310018,China)
Abstract: This paper introducedaudio - video coding technology,and gives out system’s Advanced audio-video coding. Finally,this paper explained advantage of streaming control technology.
Key word: vedio-classroom; audio-video; H.264
自“信息高速公路”提出以来,网络在全世界以惊人的速度发展着。因特网将全世界联系起来,LAN、WAN使局域网内资源、信息得以传播和共享。网络改变了人们的学习方式、生活方式、工作方式、管理方式、金融方式、文化教育方式、娱乐休闲方式。进入数字化、信息化的二十一世纪网络令信息的传播速度加速、人们的工作效率提高、世界经济发展的步伐加快。视频教室系统就是在这种背景下蓬勃发展起来。
视频教室系统(Videoconference)是指两个或两个以上不同地方的个人或群体通过传输线路及多媒体设备将声音、影像及文件资料互传达到实时互动的沟通从而完成会议目的的系统设备。视频会议系统是集通信技术、计算机技术、多媒体技术、微电子技术于一体的远程异地通信方式,它将计算机的交互性、通信的分布性以及电视的真实性有机地结合在一起。
1 音频编码
通过Internet传输实时的语音或图像与传输普通数据是不一样的,应用网络的组成必须符合这种实时传输的需要。表1列出了国际电信联盟G系列典型语音压缩标准的参数。
表1中的语音质量是在理想情况下的比较,实际上,不同的编码方法在语音质量上的性能,在不同的具体条件(如背景噪声、多重编码、丢帧影响)下有不同的表现。
在实际选择语音压缩的算法时,要综合考虑各种因素。例如,高比特率可以保证良好的话音品质,但要占用大量存储空间,耗费更多的系统资源;而过低的比特率又会影响话音的品质和增加延迟。所以,在较低比特率的前提下,保持较好的话音质量,是选择压缩算法的原则。
我们选用了G.729 A标准采用的算法,可以仅用8Kbps传输话音,话音质量与32Kbps ADPCM(G.724)相同(ADPCM(差分脉冲编码调制)在全球的公共电话网络中被用于提供长话级话音)。G.729A标准在标准PCM或线性PCM的话音采样基础上,每10ms生成一个10字节长的话音帧。这个算法提供了优秀音质,且延时很小,采用G.729A能最好的满足我公司在视频会议系统对音频实时性和高清晰方面的高要求。
静噪抑制技术,节省您的带宽提高其他应用的质量:
所谓静噪抑制技术,是指检测到通话过程或传真过程中的安静时段,并在这些安静时候停止发送语音包。大量的研究表明,在一路全双工电话交谈中,只有36%~40%的信号是活动的或有效的。当一方在讲话时,另一方在听,而且讲话过程中有大量显著的停顿。通过静噪抑制技术,大量的网络带宽节省下来用于其他话音视频或数据通信。
1.1 回声抑制技术
在视频会议的实际应用中,特别是会议室场景中,音箱放出的声音又回到麦克风返回到远程说话人那里,说话人会明显听到系统中有自己的回音。而系统允许多人同时发言,这样发生回声的可能性大大提高。为了防止类似回声对系统效果的影响,我们采用了回声消除技术,使用特殊的软件代码监听回声信号,并将它从听话人的语音信号中排除掉。
1.2 话音丢包处理技术
网络的一个特征就是网络延时与网络抖动,这可能导致音质下降。网络延时是指一个IP包在网络上传输平均所需的时间,网络抖动是指IP包传输时间的长短变化。如果网络抖动较严重,那么有的话音包因迟到而被丢弃,会产生话音的断续及部分失真,严重影
原创力文档


文档评论(0)