网易视频云：浅谈视频云直播：场景、技术及优化选编.docx

下载文档 降价啦

1
0
约 8页
2017-04-26 发布于湖北
举报
版权申诉
保障服务

网易视频云：浅谈视频云直播：场景、技术及优化选编.docx

1、本文档共8页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

网易视频云：浅谈视频云直播：场景、技术及优化选编

网易视频云：浅谈视频云直播：场景、技术及优化简介随着互联网视频化的发展，各类网络直播产品层出不穷，涌现出了秀场直播、游戏直播、教育直播、演唱会直播和监控直播等多个直播生态圈。这些生态圈形成的背后，是视频直播相关技术的不断发展，例如互联网带宽的日益增加，视频压缩标准的日渐完善，视频云技术的出现等。特别是视频云技术的出现，它降低了开发者的准入门槛，解决了视频企业的“三高”之痛，即技术门槛高、成本高、卡顿延时率高，为未来几年视频直播的大爆发奠定了坚实的技术基础。所谓视频云直播技术，就是用云端模式，提供视频直播解决方案的技术，它涉及视频直播的各个环节，例如直播视频采样、编码、推流、转码、分发、拉流、解码和播放等。使用Iaas、Paas和Saas三种形式，视频云直播能为各种场景的直播应用提供接口级服务、平台级服务和产品级服务。依托视频云，直播开发者不在关心视频和网络的细节，他们只要把精力集中于产品应用层面即可。未来，网络直播产品将会表现为如下一种形态：上层多样化的直播模式 + 下层组件化的视频云模式。深入视频云直播内部，会发现其具有复杂化、多样化和组件化的特点。所谓复杂化，是指音视频技术复杂和互联网环境复杂；所谓多样化，是指直播应用场景具有多样性；所谓组件化，是指直播技术各个环节的模块化和独立性。在视频云直播中，技术主线永远是音视频流的输入、传输和输出。但针对每一类直播场景，使用的具体技术和实现手段都不一样。随着直播量级的变化，必须对视频云各个环节进行优化，以化解流量暴增带来的压力。因此，视频云直播的构建是一项艰巨的任务。接下来，本文将从场景、技术和优化三个角度，详细阐述视频云直播。一对多直播场景考虑如下一种场景：一个主播者坐在电脑前，通过前置摄像头和麦克风，把自己的音视频信息输出到网络上，多人在各地通过互联网实时观看主播者的表演。这就是经典的秀场直播。这里存在几个关键点：一. 音视频传输；二. 实时；三. 一对多。首先讲音视频传输，它又细分为三点：源端的音视频输出、网络端的流传???和播放端的音视频获取。第一点音视频输出，首先必须收集主播的声音和图像，就是所谓的音视频采集；采集后的声音和图像，需要转换成字节码、混合并压缩，最后封装成某种音视频格式，就是所谓的音视频编码；编码后的音视频格式，还不能在网络传输，需要转换成某种码流，如RTMP，然后推送到网上，即上传码流到服务器，就是所谓的推流。上述“采样-编码-推流”，构成了视频云直播端的核心功能。第二点音视频码流的网络传输，把主播者的音视频流分发传输给所有观看者；对于无法适配源端码流的观看者，在网络端转换码流，使其也能正常观看。上述“分发-转码”，构成了视频云服务端VDN(Video Delivery Network视频分发网络)的核心功能。第三点播放端的音视频获取，首先从网络获取合适的音视频码流，就是所谓的拉流；然后对流进行解析，其中的音视频格式进行解封，就是所谓的解码；最后提取出单独的音频和视频，进行播放。上述“拉流-解码-播放”，构成了视频云播放端的核心功能。因此，如图1所示，仅秀场直播场景的音视频传输，就涵盖了视频云三个核心点: 直播端、播放端和视频分发网络，实现技术门槛很高。图1. 视频直播流程接着讲实时这一点，在直播场景中，延时性要求很高，基本不超过10秒。因此，传统的文件上传/下载模式，对于直播不可行。传统的内容分发网络(CDN)也不适用直播。视频云必须开发独特的流分发网络，应对直播场景实时性。同时，经典秀场直播无实时交互需求，延时性不要求1秒之内。因此流媒体传输，一般选用基于TCP的RTMP协议，无需选择实现难度更大但延时更低的RTP类协议。最后讲一对多模式，就是一人讲，多人听。这是一种视频云直播最擅长解决的模式。在互联网现实应用中，还有很多种其他模式，例如多对多模式，就是多人互动直播，即视频会议；二对多模式，就是两人互动，然后多人听，即连麦；一对一模式，就是两人视频互动，即实时视频聊天。各种模式，由于实时性要求不同，参与人数不同，实现难度各不相同。本文围绕的场景是一对多模式，该模式最常用。直播关键技术如图2所示，视频云直播的总体框架分为三层：最上层是直播SDK、中间为API接口层、最下面为云端服务层。各层都有一些关键技术点，例如直播SDK层主要包含直播端推流和播放端拉流两个关键技术；API接口层主要涉及安全控制这一关键技术；云端服务层主要涉及VDN流分发这一关键技术。接下来，我们详细描述这些技术点。图2. 视频云直播总框架 3.1直播端/播放端直播端和播放端是视频云直播SDK的核心。直播端是直播应用的起点，负责采样、编码和推流。播放端是直播应用的终点，负责拉流、解码和同步播放。如图3所示，播放端的处理基本上是直播端的一个逆过程。接下来，简单