网络流量分类研究.pptVIP

下载本文档

25
0
约3.35千字
约 17页
2016-11-20 发布于河南
举报
版权申诉

网络流量分类研究.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

网络流量分类研究.ppt

网络流量分类研究演讲人：衡丽花导师：王宗敏指导老师：陈刚研究背景、意义和现状流量分类基本概念当前流量分类进展几种分类方法的比较流量分类未来发展预测下一步工作主要内容自P2P网络出现以来，网络流量越来越大；网络流量管理技术可以帮助网络运营商提供更好的服务质量，还能对网络进行有效的监督管理。研究背景通过流分类，可以获悉各类网络应用所占比例，研究新的协议与应用，预测网络业务的发展趋势，合理规划网络；定期分析重要的特定流量，了解流入流出信息，发现设备故障、链路拥堵、用户带宽的使用及发现入侵和恶意攻击等。研究意义 Niksun公司的NetDetector 提供实时、连续的流量记录和分析；需时较长，工程规模复杂，费用极高； FLUKE公司的网络协议分析仪OPV_WGA 提供对网络的从一层到七层的全部分析；基于端口的传统协议；华为3Com公司的NTA（Network Traffic Analysis）基于三层协议号、端口号，可以识别上千种应用；无法分析四层至七层的应用流量； Cisco公司的SCE 采用DPI对应用层协议进行识别；只能识别已知的非加密协议；现有的网络流量分类产品 a）Bit-level：关注网络流量的数据特征 b）Packet-level：关注数据包（packet）的特征及其到达过程、延迟和丢包率等 c）Flow-level：依据地址和应用协议划分，关注流的到达过程、到达间隔及其局部特性等 d）Stream-level：关注主机对之间的应用流量不同层面（粒度）的流量分析流量分类度量标准 TP(True Positives),属于类别X并被正确预测为类别X的百分比； FN(False Negatives), 属于类别X但被预测为不是类别X的百分比； FP(False Positives),不属于类别X但被预测为类别X的百分比； TN(True Negatives),不属于类别X并被预测为不是类别X的百分比。 Accuracy： TP+TN TP+FN+FP+TN Recall: TP TP+FN Precision: TP TP+FP 依赖TCP或UDP数据包中的端口号，将熟知的端口号进行映射来识别不同的应用类型。分类器只需找到一次TCP连接中的SYN包，并从这个SYN包中找到目的端口号即可。UDP也使用类似的方法。基于端口号的流量分类根据网络应用在传输过程中所具有的特征来区分不同的应用，需要解析数据包中的特征字段。主要用于识别P2P协议流量。基于特征字段的流量分类基于传输层主机行为的流量分类分析主机在传输层的行为模式，主要有三个特点：不需要访问数据包的载荷内容；无需识别端口号；只需采集当前的流量信息。主要分析三个层次的内容：社会层：分析某台主机与哪些主机进行相互通信；功能层：研究主机在网络中的功能，即它是做为一个提供者还是请求者，或者是两者兼有；应用层：捕获特定主机间的相互作用，利用一个四元组通过观察流的特性来细化分类。基于机器学习的流量分类—分类也称监督机器学习方法，根据已标记样本的特点构造分类规则或分类器，将未知类别的样本映射到给定类别中的一个。它的输入为一些已经分好类的样本实体的集合，输出为通过这些样本产生的一个分类模型。主要包括两个过程：训练过程和分类过程。目前，分类模型的构造方法主要包括决策树、朴素贝叶斯、支持向量机、关联规则学习、神经网络、NN算法、LDA算法和遗传算法等。基于机器学习的流量分类—聚类无监督学习，它是最终要发现相似数据点的结合，相对于有监督的机器学习法，无监督学习不需要事先有待分类对象的先验知识，只是根据待分类对象的相似度分类。目前常用的聚类算法也有很多，如：k-means算法、DBSCAN、AutoClass和EM算法等。几种分类方法比较分类方法基于端口号基于特征字段基于传输层主机行为基于机器学习准确度低非常高较高较高分类速度很快慢较快慢使用场景使用传统IANA注册端口号的传统网络数据包有效负载为明文大流量骨干网络传统及新型网络应用优点简单快速适合P2P等新兴网络应用能