其他资源专业介绍基于大数据平台-实时质量监控平台的架构设计.docxVIP

其他资源专业介绍基于大数据平台-实时质量监控平台的架构设计.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于大数据平台-实时质量监控平台的架构设计 本文是声网首席数据架构师何丰,在ArchSummit全球架构师峰会深圳站,分享的内容《质量实时监控:全球音视频实时传输的关键帧》。 在全球实时音视频传输过程中,为了提供QoE质量保障,需要构建一个稳定可靠的实时数据监测系统,从而能够监测每一次通话。声网是全球首个使用大数据平台做监控和实时保障的通信技术服务商。声网的实时数据监控系统,覆盖了实时通话的全链路,包括端到端传输、用户体验监控,并且每一次通话均可回溯。因此,在构建实时数据监测系统时,面临很多“第一次”。本文包含从数据架构设计、数据收集、分析、还原、预警和使用上的很多实践经验分享。 1. 影响通话质量的因素 1.1 接入质量 一次通话的传输过程,包含很多个环节,每个环节的质量,会对整个服务的质量、乃至用户体验产生巨大影响。下面从一个印度用户与中国用户的通话讲起。在通话发起时,这个印度的用户首先会接入声网的SD-RTN实时虚拟通信网,此时,就产生了第一环节的质量问题:接入质量。影响接入质量的因素有: 最近的接入点 弱网络(2G/3G) WIFI 信号差 路由器设备问题 企业路由器限制 DNS劫持 小运营商网络 跨运营商接入 这些环节,需要一一针对性的优化。 1.2传输质量 接下来是传输质量。这个印度的用户,如果从Bangalore(班加罗尔,印度南部的城市)接入,到北京会有200ms的迟延;但是Bangalore到新加坡只有100ms,再从新加坡到北京只有60ms,这是非常理想的线路。声网的智能路由会选择从新加坡“绕道”走。此时,这个印度用户获得的体验,就是整体160ms的延迟,而不是200ms。 经过接入优化、路由传输优化,用户会获得非常好的端到端质量,丢包控制在1%,抖动和延迟能够控制在120ms。 但是,即使端到端质量非常好,有的用户看到的画面还是模糊的。这是因为,影响用户体验的除了端到端传输,还有其它因素。 1.3 用户的问题 声网在印度的终端用户,有大量用户使用下图这款手机,官网的售价大概是相当于562元人民币。 这是非常低端的设备,会出现很多中高端设备没有的问题。 声学设计缺陷、制造缺陷,造成严重的回音干扰 机型过热造成对性能的影响,导致画面卡顿甚至卡屏 硬件编解码器能力不同,也会对流畅度产生影响 1.4 软件集成的问题 在软件集成方面也会有问题,比如,开发人员用错API或者软件本身存在BUG。 当我们知道有哪些环节会影响通话质量,那么质量监控系统的功能要求也就呼之欲出了。它要能监控到每一次通话的质量。我们能通过这个系统来定位这个问题是一个个例,还是广泛存在的, 是在哪个环节出了问题。 2. 数据的实时监控 2.1 可感知、可保障 对于声网来说,我们需要对用户的通话体验进行实时监控。包括接入节点质量、路由传输层质量、音视频引擎质量以及用户体验质量。有了这些数据,我们就能够对通话过程进行诊断或者进行事后的深入复盘。声网是全球第一个使用大数据平台做监控和实时保障的通信技术服务商。我们在质量监控方面的目标是让整个通信服务的质量是可感知和可保障的。 2.2 基础网络 这是一个声网数据监控中关于基础网络质量的粗略演示。图中显示的是我们整个大网络SD-RTN的数据中心相互之间的连接的情况。红色说明两个机房之间连接的状态非常差,绿色说明非常好。 2.3 基础服务 这是基础服务的监控情况。声网要保障对98%的用户能够在1秒内完成响应,红色是代表响应时间小于1秒的百分比。 2.4 端到端的监控 这是端到端的监控,测量用户在传输区间的数据,包括延迟、丢包。图中的丢包,是网络优化后的丢包,不是实际的丢包。 2.5 用户体验的监控 最后是用户体验方面的监控,比如直播场景下,根据用户的观感体验所做的监控,观众的卡顿。 2.6 告警 这是我们自己开发的一个APP。声网的服务出现任何不稳定的情况时,通过这个APP都可以接收到告警。拿Hike作为一个例子,我们首先会定义什么叫优质接入,当优质接入的比例低于80%的时候,我们就会触发告警。过了一段时间恢复了,同样会接收到提示。 2.7 个例调查 前文说的是一个整体监控。如果个别用户出现突发状况时,比如网络特别差或者手机特别差。我们需要把整个过程还原出来,调查出是哪个环节出了问题,作为后续质量改进的依据。所以,我们会把所有通话各个层次的工作指标实时收集保存下来,这样就能够用于在线现场分析,或者事后复盘。 这是两个用户在打电话的数据实时监控,图中的数据包含:音频的渲染、视频的渲染、用户上行的丢包、上行的延迟等等信息。 3. 系统架构与挑战 这样一个实时监控体系,包含几百个指标,每个用户的数据都要实时收集、实时分析。所以,我们需要一个稳定的架构来支撑这样的海量数据和运算量。 上图是一个架构简图。我们的用

您可能关注的文档

文档评论(0)

WanDocx + 关注
实名认证
文档贡献者

大部分文档都有全套资料,如需打包优惠下载,请留言联系。 所有资料均来源于互联网公开下载资源,如有侵权,请联系管理员及时删除。

1亿VIP精品文档

相关文档