基于支持向量机网络流量分类方法.docVIP

下载本文档

8
0
约2.23千字
约 5页
2017-06-10 发布于福建
举报
版权申诉

基于支持向量机网络流量分类方法.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于支持向量机网络流量分类方法

基于支持向量机网络流量分类方法　　摘要本文将机器学习分类方法，引入到网络流量领域。结合构风险最小化原则，提出基于支持向量机的网络流量分类方法，将网络流量分类问题转化为二次寻优问题，以解决网络流量过程中训练样本较少和属性过滤等问题。实验表明，支持向量机网络流量分类方法，有效地保证网络流量分类的精度，具有较好的推广性【关键词】网络流量分类机器学习支持向量机近年来，随着互联网规模的迅速发展，网络拥堵问题日益加剧。因此，容量规划、流量调度等网络流量控制策略成为网络安全与管理领域研究的热点问题。在网络流量分类研究中，分类对象通常是网络报文，而在海量的网络数据集合下，网络报文流量分类精度会因为维数的增高而下降。传统的分类算法有近邻、朴素贝叶斯等方法。然而上述传统算法实际应用中，在已知样本有限情况下，难以构建有效的分类规则，无法保证分类精度支持向量机方法是建立在统计学习理论基础上，根据结构风险最小化原则，将分类问题转化为二次寻优问题（即寻找最优超平面），从而避免在分类学习过程中对训练样本的依赖，同时具有较高的分类精度。目前，支持向量机方法在文本分类、图像识别等多个领域，具有较好的推广性。因此，本文将支持向量机学习方法引入到网络流量分类中，以利用该算法的特点，解决实际的网络流量分类问题 1 网络流量分类目前主流的网络流量分类方法是以网络报文作为分类元素，按照一定的策略和学习算法进行分类，将特定端口的网络流量划分到相对应的网络，以便进行网络管理。但海量的网络报文数据呈高维分布，且大多数特征项决策因子较低，难以满足分类需求。因此，现阶段的分类方法均是?ν?络报文做降维处理，提取对分类有影响的特征项，即以报文序列相同的5元组作为取值对象（源IP、目的IP、源端口、目的端口、协议），构成网络流。其中网络流又分为单向流和双向流。单向流是以5元组的单向网络传输报文序列作为特征项。双向流是同一网络连接的双向报文5元组序列。通过对网络报文特征项的提取，建立特征集合，进而利用机器学习建立多分类问题。网络流量分类问题可以概括为：已知属性集合，报文流集合，利用分类学习算法构建模型，依据分类模型对未知网络报文进行分类 2 支持向量机网络流量分类方法支持向量机是建立在统计学习理论基础上，以结构结构风险最小化为原则，寻求最优超平面的学习方法。支持向量机的二次寻优问题可以表示为：已知样本x在样本集合m中存在n个样本，超平面为。其中，，，对于网络流量分类问题，本文采用“一对一”方法，根据支持向量机的特点，将多元的网络流量分类问题，转换为元分类问题，将分类判别函数转换为网络流量分类模型，即：支持向量机网络流量分类方法可以描述为以下三点：（1）通过将实际问题转换到高维特征空间中，构建分类决策函数，使得在原维数的非线性问题转换为线性可分，有效地提高分类精度（2）支持向量机将网络流量分类转化为二次寻优，在已知样本（训练样本）较少的情况下，能够保证分类的准确性（3）支持向量机通过最优超平面来优化分类器的学习能力，该方法不需要依赖网络流量样本的先验概率，具有较好的推广性 3 实验结果与分析本文选取Moore_Set数据集合中，提取10个数据子集（每个数据子集选取100条样本）。其中1个数据子集作为训练集，其他9个数据子集作为测试集。学习算法选取朴素贝叶斯算法和支持向量机方法进行比较分析，结果如表1 从表1中可以看出，朴素贝叶斯方法分类方法，其准确率会随着训练集的增加而下降。特别是到900个训练样本时，分类准确率仅为56.95%。支持向量机分类方法相比较而言，分类精度不会随着维数的增高而下降，比较稳定。通过实验表明，支持向量机分类方法以最优超平面构建分类模型，在划分网络流量时，维数的增加，不会对分类结果产生较大的影响，相比较而言，支持向量机网络流量分类方法具有健壮性，有较好的推广价值 4 小结网络流量分类是近年来网络安全与管理领域的热点研究问题。目前主流的研究均是利用机器学习方法构建分类规则，从而完成多元分类问题。本文将支持向量机方法引入到网络流量分类学习中，并与传统方法进行比较研究。通过实验可以看出支持向量机方法在稳定性、准确率等方面均有明显优势，具有一定的推广价值。今后的研究重点在于如何从海量数据集中提取对分类有影响的子集，以进一步提高分类性能参考文献 [1]朱明.数据挖掘[M].合肥：中国科技大学出版社，2008：13-56. [2]丁世飞等.支持向量机理论与算法研究综述[J].电子科技大学学报，2011（07）. [3]林平等.基于流统计特性的网络流量分类算法[J].北京邮电大学学报，2008（09）. [4]刘颖秋等.网