- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
网络流量分类国内外研究现状
摘 要 近年来,随着互联网的迅猛发展,大数据(The Big Data)时代已经到来,越来越多的新型网络应用逐渐兴起,网络规模不断扩大,网络组成也越来越复杂。网络流量分类技术作为增强网络可控性的基础技术之一,不仅可以帮助网络运营商提供更好的服务质量,而且能够对网络进行有效的监督管理,确保网络安全。本文介绍了国内外关于网络流量分类方法以及算法的研究现状,据此以望给相关领域的人提供一定的参考和帮助。
关键词 大数据 The Big Data 网络流量分类 国内外研究现状 随着The Big Data的概念的提出,网络流量分类研究的关注程度也水涨船高。在复杂的网络计算机环境中,尤其是云计算环境中,网络流量分类技术对于确保网络和系统的安全性有着极为重要的作用。
网络流量分类技术在现代网络安全和管理体系中扮演着极为重要的角色。它能有效地处理很多网络安全问题包括合法截取和入侵检测等问题。比如,网络流量分类可以用作检测服务攻击,蠕虫病毒传播,网站入侵,垃圾邮件传播。此外,网络流量分类在现代网络管理体系中同样扮演着极为重要的作用,如服务质量控制(QoS)。鉴于网络流量分类在网络系统中发挥如此至关重要的作用,网络流量分类技术的需求也越来越大。
网络流量分类是指按照网络的应用类型(比如WWW、TFTP、P2P等),将基于TCP/IP协议的网络通信产生的双向UDP流或TCP流进行分类。网络流量分类技术虽然在很久以前就已经被提出,而且相关的分类技术也已经大量被提出,但是随着网络的复杂性越来越大,尤其是云计算的提出,使得网络分类技术面临新的机遇和挑战。因此,分析网络流量分类的国内外研究现状就显得极为必要了。
网络流量分类国内研究现状
国内学者对于网络流量分类的算法以及技术研究虽然历时不长,起步较晚并缺乏一定的系统性,但仍以方兴未艾之势不断完善和深入,尤其是近几年,在相关领域也取得了一些突破性的进展。
(1)基于决策树的网络流量分类
传统的基于端口和基于深度包检测的网络流量分类方法因为p2p及载荷加密等技术的流行而变得失效。基于“网络流”统计特征和机器学习的方法因为能够有效地解决这些问题而成为了流量分类领域的新方向。于孝美,陈贞翔,彭立志[1]提出基于C4.5决策树算法,根据训练集中属性的信息增益比率构建分类模型,按属性对检测数据进行预测,通过查找分类模型实现对网络流量的分类。
吴耿[2]首次将C4.5_cs决策树算法应用到网络流量的分类当中,并根据流量分类这一实际背景给出了一种计算C4.5_cs代价矩阵的方法。相比其他方法,采用C4.5_cs算法的流量分类器具有更高的“字节分类准确率”,适合于不平衡流量的分类。
朱欣、赵雷、杨季文[3]针对网络流量数据大、动态变化性高的问题,提出一种基于数据挖掘技术——概念自适应快速决策树(CVFDT)的网络流量识别方法。CVFDT适合于处理流动数据,随数据样本分布的变化更新模型,并能处理概念漂移。
赵小欢,夏靖波,李明辉[18]针对传统的单一分类算法需要构建基于特定假设的某种模型,算法对于待分类数据的分布要求高,不能满足复杂多变的网络流量的分类要求。他们采用多决策树组合的随机森林算法实现网络流量分类。
基于机器学习的网络流量分类
关于基于机器学习的网络流量分类算法主要分为三个方面:贝叶斯方法、神经网络、支持向量机(Support Vector Machine SVM)三种。对于这三种方法,国内一些学者根据不同的一些网络提出一些新的见解和改进方法。
1.贝叶斯方法
邓职洁,王勇,陶晓玲[4]三人针对传统网络流量方法不能很好地满足高速网络流量分类的实时性和准确性要求,提出了一种基于FPGA二次加权朴素贝叶斯网络流量分类方法。提高分类精度的同时具有更好的实时性。
张立仿,张喜平,柴旭清等人[5]针对传统的基于传输层端口和基于特征码的流量分类技术准确率低、应用范围有限等缺点,提出了使用树扩展的贝叶斯分类器的方法,该方法利用网络流量的统计属性和基于统计理论的贝叶斯方法构建分类模型,并利用该模型对未知流量进行分类。
佘锋,王小玲[14]提出了基于半监督学习的网络流量分类方法,传统的基于NB分类的监督学习方法用少量已标记的例子产生的分类器,往往不能归纳以前没出现的流类型,因此提出了一个不用于传统半监督学习应用的结合监督和非监督的方法。
2.神经网络
胡婷[6]在基于神经网络的网络流量分类方法中引入了检测精度高的有监督的误差方向传播算法(Back-Propagation Algorithm,BP算法)改进了自组织、自适应性强的无监督的自组织映射(Self-OrganizingMapping,SOM)方法。
胡婷,王勇,陶晓玲[12]提
您可能关注的文档
- 最新的狂犬病疫苗接种禁忌与不良反应处理.ppt
- 第二章 NET使用手册.pptx
- 骨质疏松症与伊班膦酸钠的应用.ppt
- 灾难事故避险自救形成性考核册答案--作业一资料.doc
- 合同撤销的方法与后果.doc
- 信号和线性系统的几个基本问题.docx
- 统计学2012-2013学年第二学期(A)指南.docx
- 4私有数据成员及友元.doc
- 如何设置光盘第一驱动.docx
- 华为网络技术大赛模拟题答案与解析.docx
- 2025年廊坊燕京职业技术学院单招职业技能考试题库及答案1套.docx
- 高二生物动物生命活动的调节.pptx
- 2025年廊坊燕京职业技术学院单招职业技能考试题库附答案.docx
- 动态时空关联特性下混凝土坝变形深度学习模型研究.docx
- 2025年廊坊燕京职业技术学院单招职业技能测试题库最新.docx
- 2025年廊坊燕京职业技术学院单招职业适应性测试题库及答案1套.docx
- 绿色制造工艺创新-第1篇-深度研究.pptx
- 2025年廊坊燕京职业技术学院单招职业技能考试题库最新.docx
- 绿色制造技术在电工行业应用-深度研究.pptx
- 2025年廊坊燕京职业技术学院单招职业技能考试题库必考题.docx
文档评论(0)