基于数据流挖掘的流量识别技术研究-计算机技术专业论文.docxVIP

  • 10
  • 0
  • 约4.37万字
  • 约 48页
  • 2019-03-30 发布于上海
  • 举报

基于数据流挖掘的流量识别技术研究-计算机技术专业论文.docx

基于数据流挖掘的流量识别技术研究 基于数据流挖掘的流量识别技术研究 I万方数据 I 万方数据 摘 要 随着互联网技术高速发展,各类新型的网络应用使网络流量急剧增长,对带宽的无秩 序、无节制的抢占,为网络带宽资源的管理带来了的巨大挑战。网络流量识别技术的研究 可解决带宽资源使用不合理而造成的业务质量下降问题,为实时监控不同业务的使用质量, 链路负载均衡,减少带宽资源浪费,提升关键业务传输效率等提供科学依据。此外,网络 流量识别对于各种网络计费、网络安全、流量工程等领域也是至关重要的。 本文首先分析流量识别技术的研究现状,给出了网络流量识别技术的评价标准和识别 结果评价指标,并对目前网络流量实时识别中的存在的问题进行了分析,给出了解决对策。 然后重点研究了基于数据流挖掘的流量识别技术,并作了比较。最后设计了基于数据流挖 掘的流量识别系统。论文的主要研究内容和创新成果如下: (1) 本文将 CVFDT(Concept-adapting Very Fast Decision Tree)算法应用到在网络流量 识别中,CVFDT 是一种数据流分类算法,可以随着训练样本的到来动态的更新分类模型, 可以解决概念漂移问题,并采用目前权威数据通过实验比较了 CVFDT 算法和 VFDT 算法 的分类准确率和解决概念漂移的能力; (2)采用 CVFDT 算法设计了实时流量识别系统,给出了系统的总体设计,给出了流量 采集、采样、流汇聚、流实时属性选择、构建决策树和类标记等关键技术的实现方法。流 量采集是采用 Linux 下的包捕获库 Libpcap;采样技术是采用简单随机采样方法,采用采样 技术可以解决软件采集产生严重丢包率的问题;流汇聚通过比较数据包五元组来确定数据 包是否属于一条流,然后将数据包汇聚成流;流实时属性选择是选择了具有实时性、差异 性的属性集,并且选取了流的一部分作为计算区间,降低了时间复杂度和空间复杂度;构 建决策树则是根据 CVFDT 算法构建可以随时更新的决策树;分类模块则是利用实时属性 选择模块计算的属性值作为输入,对流量完成类标记。通过在校园网中进行流量的采集和 识别,本文的流量实时识别系统可以有效辅助网络应用情况的统计和预测。 关键词:流量识别;数据流挖掘;CVFDT;概念漂移;属性选择 II万方数据 II 万方数据 Abstract With the rapid development of internet technology, all kinds of new typed network application increased network traffic sharply, which brought a huge challenge for bandwidth’s disorder immoderate preemption and the network bandwidth resources management. Network traffic identification technology research solved the decrease of service quality due to unreasonable using of bandwidth resource, which provided a scientific grounding for real-time monitoring the use of different business quality, link load balancing, reducing the waste of bandwidth resources and increasing key business transmission efficiency. In addition, network traffic identification also played an important role in sorts of network accounting, network security and traffic engineering. This article analyzed the current research situation of traffic identification technology firstly. The evaluation criteria and recognition results’ evaluation indicators of network traffic identification technology was given. The existing problems in th

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档