基于半监督学习的网络流量特征选择与分类方法研究-计算机应用技术专业论文.docxVIP

基于半监督学习的网络流量特征选择与分类方法研究-计算机应用技术专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
万方数据 万方数据 独创性(或创新性)声明 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研 究成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中 不包含其他人已经发表或撰写过的研究成果;也不包含为获得桂林电子科技大学 或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所 做的任何贡献均已在论文中做了明确的说明并表示了谢意。 申请学位论文与资料若有不实之处,本人承担一切相关责任。 本人签名: 日期: 关于论文使用授权的说明 本人完全了解桂林电子科技大学有关保留和使用学位论文的规定,即:研究 生在校攻读学位期间论文工作的知识产权单位属桂林电子科技大学。本人保证毕 业离校后,发表论文或使用论文工作成果时署名单位仍然为桂林电子科技大学。 学校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全 部或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。(保密的论 文在解密后遵守此规定) 本学位论文属于保密在 年解密后适用本授权书。 本人签名: 日期: 导师签名: 日期: 摘要 摘要 摘 要 网络流量特征选择方法是决定分类器差异性设计的关键,能够提高分类结果的可 理解性,发现高维数据隐藏的结构;高效的流量分类有助于网络态势分析与动态访问 控制,是实现网络管理、流量控制以及安全检测的重要环节;特征选择和流量分类方 法应相互支撑,相互促进。针对传统有监督学习的流量分类方法不能发现未知的流量 类别,无监督学习的流量分类方法分类精度较低的不足,利用半监督学习同时兼具有 监督信息和无监督信息的优势,提出基于半监督学习的网络流量特征选择与分类方 法,解决现有方法监督信息缺乏,多分类器泛化能力有限等问题。论文的创新性工作 主要包括以下几个方面: (1)针对大量冗余特征制约网络流量分类性能提高的问题,提出一种基于混合 约束的半监督网络流量特征选择方法。该方法采用结合成对约束和无标记样本的特征 评价方式,快速去除不相关特征,并通过利用基于互信息的特征相关性过滤剩余特征 中的冗余特征,使有监督信息和无监督信息在网络流量的特征选择过程中以不同的方 式发挥作用。实验结果表明,该方法能以有效混合约束特征获得更好的网络流量分类 性能。 (2)针对网络流量特征选择过程中监督信息缺乏的问题,提出一种基于成对约 束扩展的半监督网络流量特征选择方法。该方法利用样本集合间的相关性和自相关 性,同时考虑少量成对约束和大量无标记样本,扩展成对约束集到无标记样本上,以 揭示样本空间分布信息。实验结果表明,在监督信息有限的情况下,扩展的成对约束 仍具有较好的可靠性。 (3)针对传统网络流量分类方法准确率低、开销大的问题,提出一种基于支持 向量机的半监督网络流量分类方法。该方法在支持向量机训练中,利用大量未标记和 少量已标记样本对分类器进行反复修正,并使用增量学习技术避免不必要的重复训 练,改善因新样本导致原分类器分类准确率降低、分类时间长的情况;同时,利用多 分类器的协同优势,改进 Tri-training 方法,克服传统协同验证对分类算法及样本类 型要求苛刻的不足。实验结果表明,该方法可明显提高网络流量分类的准确率和效率。 (4)针对多分类器集成在泛化能力方面的局限性,提出一种基于多分类器选择 性集成的半监督网络流量分类方法,该方法从基分类器的精度和基分类器间的差异性 出发,剔除相关性和冗余性较大的基分类器,解决多分类器的选取问题。设计并实现 了基于该方法的网络流量多分类器选择性集成模型,详细设计了流量采集、流量解析、 特征分析和流量分类模块,从整体上提高选择性集成的预测性能。实验结果表明,提 出的方法及模型能充分利用基分类器间的互补性,具有良好的泛化性。 关键词:流量分类;特征选择;半监督学习;成对约束;协同训练;选择性集成 I Abstract Abstract Abstract Network traffic feature selection methods are the key to design differentiated classifiers, they can improve the understandability of classification results and find the hidden structure of high-dimensional data. Efficient traffic classification plays an increasingly important part in network management, traffic control, safety detection, which contributes to network

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档