Network Traffic分类的方法比较分析.docVIP

下载本文档

28
0
约4.27千字
约 9页
2018-10-11 发布于福建
举报
版权申诉

Network Traffic分类的方法比较分析.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

Network Traffic分类的方法比较分析

Network Traffic分类的方法比较分析　　摘要：准确的流量分类是网络管理的前提，比较分析了基于端口、基于数据包、基于主机行为、基于机器学习的四种流量分类方法的优缺点，展望了流量分类技术未来发展方向。　　关键词：网络流量；分类方法；机器学习　　中图分类号：TP393 文献标识码：A 文章编号：1009-3044（2013）33-7420-03 　　如何对各种纷繁复杂的网络应用进行识别对于网络管理和监控来说非常重要，从网络安全监控到网络计费，从QoS（ Quality of Service）到提供给用户长期有价值的预测信息等，从近期引起广泛争议的美国政府合法监听网络的“棱镜”项目，也说明流量分类可帮助ISP及时识别疑犯在网络任意给定位置使用了何种类型应用。　　1 基于端口号匹配方法　　早期的网络流量分类方法基于传输层端口号，基于端口号的分类器检查每个数据包的端口号，然后根据国际互联网代理成员管理局（IANA）公布的标准端口号和注册端口号列表来查找确定不同的应用类型。例如分类器要想知道服务器端一个新的客户机/服务器的TCP连接类型仅需查找TCP_SYN数据包（这是TCP协议在建立会话过程中三次握手的第一步），通过查找IANA注册端口号表中的TCP_SYN数据包的目的端口号从而推断出应用类型。UDP协议是无连接建立也没有连接状态保持的协议，它也使用类似的端口号匹配方法。　　尽管端口号匹配法是最快和最简单的方法，但其存在缺陷。首先，有些应用并不在IANA注册其端口号。第二，有些应用并不使用它的默认端口号以规避操作系统对它的存取控制限制（例如在类似Unix系统中未被授权的用户运行HTTP服务时将被强制禁用端口号80）。第三，在一些情况下服务器端口号将根据需要进行动态分配。例如RealVideo流允许采用动态协商服务器端口号的方式来进行数据传送，在一开始使用默认的标准RealVideo控制端口号建立起来的连接中，服务器的端口号可以通过动态协商而得到。另外，在一些环境下对IP层的信息加密也可能造成TCP_Header和UDP_Header模糊，因此分类器不可能知道其实际的端口号。　　Moore等人[1]指出，若使用官方的IANA表，使用基于端口号的分类器准确率将低于70%。Karagiannis等人[2]指出大量的P2P应用使用随机端口传输数据，使得基于默认端口的流量识别方法难以准确标识P2P等新型网络应用。　　2 基于数据包检测方法　　数据包检测方法[3]是通过解析应用层协议数据包载荷特征字符来区分不同的应用。这种方法曾被誉为最为准确的流量识别方法，目前仍为大多数商用系统所采用。但是这需要较高的计算复杂度和访问较多的数据包才能完成。例如，根据Moore等人研究，仅有少量特殊的应用可通过第一个数据包（有载荷数据）而被正确分类，而其他的应用则需更详细的检测，只能当检测到的载荷数据量达到1Kbyte时才能确定其应用类别。匹配特征值可通过公开出版的协议规范获得。　　除了需要访问载荷数据，这种方法也不能处理载荷数据加密的应用。首先，面对应用协议的频繁更新、载荷加密技术的普及、新应用频出等状况，该方法的有效性已逐步降低。第二，维护特征库需耗费计算资源和计算时间，其适用范围有限。第三，采集和解析载荷记录受到侵犯用户隐私权等法律问题的约束。　　3 基于传输层行为模式方法　　Karagiannis等人提出一种基于传输层行为的流量分类方法即BLINC[4]（盲分类器），该方法利用不同网络应用在传输层连接模式的差异来划分网络流量，无需解析数据包载荷或知晓端口号，具有良好的可扩展性。其原理是通过描述网络主机在社会层、功能层和应用层三个层次的内在行为特性来识别主机的角色，进而对该主机的相关流量进行分类。（1）社会层面：获取一个主机与其他与之通讯的主机的数量。凭直觉，在这个层面将首先关注这台主机与其他主机交互的活跃性，其次识别与这台主机通信的节点。（2）功能层面：捕获主机的行为特征，分析其在网络中扮演角色是业务提供者还是业务接受者或两者兼有。例如若一台主机用一个端口与其他多台主机通信，那么这台主机在这个端口上应该是一个业务提供者角色。（3）应用层面：捕获特定主机的特定端口传输层之间的互动识别业务的发起方。　　BLINC分类器主要优点之一在于它的可调性。分类条件的严格性可按测量目标的不同而上下浮动。条件标准可松可紧便于在分类完整性与准确性之间的不同平衡点上得到分类识别结果。然而行为模式方法利用了网络应用的行为属性，不仅极易受到网络环境的影响，而且随着网络应用的自身完善而逐步失效。例如，它依赖于每个主机产生的流是否包含了足够的行为信息，所以使用BLINC的最佳位置应是单宿主的边缘网络，只有在边缘网才能尽可能