- 10
- 0
- 约4.37万字
- 约 48页
- 2019-03-30 发布于上海
- 举报
基于数据流挖掘的流量识别技术研究
基于数据流挖掘的流量识别技术研究
I万方数据
I
万方数据
摘 要
随着互联网技术高速发展,各类新型的网络应用使网络流量急剧增长,对带宽的无秩 序、无节制的抢占,为网络带宽资源的管理带来了的巨大挑战。网络流量识别技术的研究 可解决带宽资源使用不合理而造成的业务质量下降问题,为实时监控不同业务的使用质量, 链路负载均衡,减少带宽资源浪费,提升关键业务传输效率等提供科学依据。此外,网络 流量识别对于各种网络计费、网络安全、流量工程等领域也是至关重要的。
本文首先分析流量识别技术的研究现状,给出了网络流量识别技术的评价标准和识别 结果评价指标,并对目前网络流量实时识别中的存在的问题进行了分析,给出了解决对策。 然后重点研究了基于数据流挖掘的流量识别技术,并作了比较。最后设计了基于数据流挖 掘的流量识别系统。论文的主要研究内容和创新成果如下:
(1) 本文将 CVFDT(Concept-adapting Very Fast Decision Tree)算法应用到在网络流量 识别中,CVFDT 是一种数据流分类算法,可以随着训练样本的到来动态的更新分类模型, 可以解决概念漂移问题,并采用目前权威数据通过实验比较了 CVFDT 算法和 VFDT 算法 的分类准确率和解决概念漂移的能力;
(2)采用 CVFDT 算法设计了实时流量识别系统,给出了系统的总体设计,给出了流量 采集、采样、流汇聚、流实时属性选择、构建决策树和类标记等关键技术的实现方法。流 量采集是采用 Linux 下的包捕获库 Libpcap;采样技术是采用简单随机采样方法,采用采样 技术可以解决软件采集产生严重丢包率的问题;流汇聚通过比较数据包五元组来确定数据 包是否属于一条流,然后将数据包汇聚成流;流实时属性选择是选择了具有实时性、差异 性的属性集,并且选取了流的一部分作为计算区间,降低了时间复杂度和空间复杂度;构 建决策树则是根据 CVFDT 算法构建可以随时更新的决策树;分类模块则是利用实时属性 选择模块计算的属性值作为输入,对流量完成类标记。通过在校园网中进行流量的采集和 识别,本文的流量实时识别系统可以有效辅助网络应用情况的统计和预测。
关键词:流量识别;数据流挖掘;CVFDT;概念漂移;属性选择
II万方数据
II
万方数据
Abstract
With the rapid development of internet technology, all kinds of new typed network application increased network traffic sharply, which brought a huge challenge for bandwidth’s disorder immoderate preemption and the network bandwidth resources management. Network traffic identification technology research solved the decrease of service quality due to unreasonable using of bandwidth resource, which provided a scientific grounding for real-time monitoring the use of different business quality, link load balancing, reducing the waste of bandwidth resources and increasing key business transmission efficiency. In addition, network traffic identification also played an important role in sorts of network accounting, network security and traffic engineering.
This article analyzed the current research situation of traffic identification technology firstly. The evaluation criteria and recognition results’ evaluation indicators of network traffic identification technology was given. The existing problems in th
您可能关注的文档
- 基于免疫理论的项目合同风险管理研究管理科学与工程专业论文.docx
- 基于企业层面的新能源汽车发展战略研究-企业管理专业论文.docx
- 基于平衡计分卡的ERP项目实施绩效评价体系分析-管理科学与工程专业论文.docx
- 基于全寿命周期理论的高校建筑节能管理研究-工程经济与管理专业论文.docx
- 基于网格和密度的数据流聚类研究-计算机软件与理论专业论文.docx
- 基于遗传算法的决策树优化算法研究-计算数学专业论文.docx
- 基于投入法的义务教育生均经费标准测算及应用研究-财政学专业论文.docx
- 基于农户调查的焦作市耕地流转意愿及影响因素分析-土地资源管理专业论文.docx
- 基于商品品类的零售供应链需求预测与库存管理模式研究-管理科学与工程专业论文.docx
- 基于全面培训的知识共享理论与实证研究-产业经济学专业论文.docx
- 2025年全国演出经纪人员资格认定考试试卷带答案(研优卷).docx
- 2025年全国演出经纪人员资格认定考试试卷完整版.docx
- 2025年全国演出经纪人员资格认定考试试题库及完整答案.docx
- 2025年全国演出经纪人员资格认定考试试卷完美版.docx
- 2025年全国演出经纪人员资格认定考试试卷含答案(实用).docx
- 2025年全国演出经纪人员资格认定考试试卷及答案(各地真题).docx
- 2025年下半年内江市部分事业单位公开考试招聘工作人员(240人)备考题库附答案.docx
- 2025年全国演出经纪人员资格认定考试试卷及答案1套.docx
- 2025年下半年四川成都市郫都区面向社会引进公共类事业单位人员2人备考题库最新.docx
- 2025年下半年内江市部分事业单位公开考试招聘工作人员(240人)备考题库附答案.docx
原创力文档

文档评论(0)