网络流量分类研究.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
网络流量分类研究.ppt

网络流量分类研究 演讲人:衡丽花 导 师:王宗敏 指导老师: 陈 刚 研究背景、意义和现状 流量分类基本概念 当前流量分类进展 几种分类方法的比较 流量分类未来发展预测 下一步工作 主要内容 自P2P网络出现以来,网络流量越来越大; 网络流量管理技术可以帮助网络运营商提供更好的服务质量,还能对网络进行有效的监督管理。 研究背景 通过流分类,可以获悉各类网络应用所占比例,研究新的协议与应用,预测网络业务的发展趋势,合理规划网络; 定期分析重要的特定流量,了解流入流出信息,发现设备故障、链路拥堵、用户带宽的使用及发现入侵和恶意攻击等。 研究意义 Niksun公司的NetDetector 提供实时、连续的流量记录和分析; 需时较长,工程规模复杂,费用极高; FLUKE公司的网络协议分析仪OPV_WGA 提供对网络的从一层到七层的全部分析; 基于端口的传统协议; 华为3Com公司的NTA(Network Traffic Analysis) 基于三层协议号、端口号,可以识别上千种应用; 无法分析四层至七层的应用流量; Cisco公司的SCE 采用DPI对应用层协议进行识别; 只能识别已知的非加密协议; 现有的网络流量分类产品 a)Bit-level:关注网络流量的数据特征 b)Packet-level:关注数据包(packet)的特征及其到达过程、延迟和丢包率等 c)Flow-level:依据地址和应用协议划分,关注流的到达过程、到达间隔及其局部特性等 d)Stream-level:关注主机对之间的应用流量 不同层面(粒度)的流量分析 流量分类度量标准 TP(True Positives),属于类别X并被正确预测为类别X的百分比; FN(False Negatives), 属于类别X但被预测为不是类别X的百分比; FP(False Positives),不属于类别X但被预测为类别X的百分比; TN(True Negatives),不属于类别X并被预测为不是类别X的百分比。 Accuracy: TP+TN TP+FN+FP+TN Recall: TP TP+FN Precision: TP TP+FP 依赖TCP或UDP数据包中的端口号,将熟知的端口号进行映射来识别不同的应用类型。分类器只需找到一次TCP连接中的SYN包,并从这个SYN包中找到目的端口号即可。UDP也使用类似的方法。 基于端口号的流量分类 根据网络应用在传输过程中所具有的特征来区分不同的应用,需要解析数据包中的特征字段。主要用于识别P2P协议流量。 基于特征字段的流量分类 基于传输层主机行为的流量分类 分析主机在传输层的行为模式,主要有三个特点:不需要访问数据包的载荷内容;无需识别端口号;只需采集当前的流量信息。 主要分析三个层次的内容: 社会层:分析某台主机与哪些主机进行相互通信; 功能层:研究主机在网络中的功能,即它是做为一个提供者还是请求者,或者是两者兼有; 应用层:捕获特定主机间的相互作用,利用一个四元组通过观察流的特性来细化分类。 基于机器学习的流量分类—分类 也称监督机器学习方法,根据已标记样本的特点构造分类规则或分类器,将未知类别的样本映射到给定类别中的一个。它的输入为一些已经分好类的样本实体的集合,输出为通过这些样本产生的一个分类模型。主要包括两个过程:训练过程和分类过程。 目前,分类模型的构造方法主要包括决策树、朴素贝叶斯、支持向量机、关联规则学习、神经网络、NN算法、LDA算法和遗传算法等。 基于机器学习的流量分类—聚类 无监督学习,它是最终要发现相似数据点的结合,相对于有监督的机器学习法,无监督学习不需要事先有待分类对象的先验知识,只是根据待分类对象的相似度分类。 目前常用的聚类算法也有很多,如:k-means算法、DBSCAN、AutoClass和EM算法等。 几种分类方法比较 分类方法 基于端口号 基于特征字段 基于传输层主机行为 基于机器学习 准确度 低 非常高 较高 较高 分类速度 很快 慢 较快 慢 使用场景 使用传统IANA注册端口号的传统网络 数据包有效负载为明文 大流量骨干网络 传统及新型网络应用 优点 简单快速 适合P2P等新兴网络应用 能

文档评论(0)

uqxw + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档