- 1
- 0
- 约6.07万字
- 约 79页
- 2019-03-28 发布于上海
- 举报
摘
摘 要
随着信息技术和数据库技术的迅猛发展,人们能够获取的数据也与 日俱增,对数据的加工处理已经成为人们获取有用信息不可缺少的工具。 数据挖掘是一种通用的知识发现技术,利用各种分析工具在大量数据中 发现模型和数据间的关系的过程。聚类分析是数据挖掘技术中重要的组 成部分,数据聚类挖掘技术是一个正在蓬勃发展的领域,涉及了人们生活 的各个方面。
·模糊聚类FCM(Fuzzy C-means)算法是的一种重要的无监督学习的数 据聚类挖掘方法,已成为聚类分析技术研究的热点。该算法具有结构简 单、局部搜索能力强且收敛速度快的特点,然而FCM算法容易受聚类初 始化的影响,而且在迭代时非常容易陷入局部极小。遗传算法是一种随 机搜索的全局优化算法,它通过模拟自然进化过程对最优解进行搜索, 其显著的特点是具有并行性及对搜索范围的全局性。如果将FCM算法和 遗传算法相结合,用遗传算法来解决聚类问题,既能发挥遗传算法的全 局寻优能力,又能兼顾FCM算法的局部搜索能力,从而大大提高算法的 性能。
本文提出了一种基于改进遗传算法的模糊聚类算法(IG.FCM),该算 法首先采用遗传算法的全局搜索特性对初始聚类中心进行全局优化,接 着运用FCM算法的局部寻优特性进一步的最优解搜索。IG.FCM算法采 用了一种启发式聚类的方法,通过有序改变聚类类别数目,利用聚类有 效性评价函数自动确定最优聚类数目及最优聚类结果。由于采用传统遗 传算法进行聚类会出现算法收敛速度慢,以及稳定性不高、精准性低等 问题,本文改进的遗传算法采取最优保存策略来保留当前种群中适应度 最高的个体,让其副本及其他个体进行最大适应度差异交叉操作,确保 遗传算法优良基因迭代的稳定性,避免不良基因的扩散,提高了算法的 收敛速度和精确度。
本文在IG-FCM聚类算法研究的基础上,针对现有的入侵检测系统 检测性能的不足以及聚类算法在入侵检测系统中应用的特点,提出了基 于改进遗传算法的特征加权模糊聚类算法(I(3.WFCM)算法,将该算法 用于入侵检测系统中训练数据集的聚类划分,以此为依据来检测网络数 据是否正常。基于IG.WFCM算法的入侵检测系统采用将连续型属性和
离散型属性分别处理的数据预处理方式,数据之间相似性度量采用加权
离散型属性分别处理的数据预处理方式,数据之间相似性度量采用加权 的混合距离度量方式,并且采用设定正常数据类集聚类宽度阈值的方法 来检测异常数据,以此来提高入侵检测系统的检测率。
本文通过采用KDD CUP 1 999入侵检测数据集进行了仿真实验,结 果显示IG.WFCM算法的平均检测率达到了80.1%,平均误警率保持为 1.605%左右。这充分表明IG.WFCM算法的可行性和有效性,能够克服 FCM算法易陷入局部极小值、检测精度低等缺陷,在一定程度上提高了 入侵检测系统的性能和效率。
关键词:数据挖掘:入侵检测;遗传算法;模糊聚类
n
AB
AB STRACT
With information technology and database technology developing at very fast speed,information processing has become a indispensable tool for people to acquire useful message.Data mining is a generic knowledge discovery technology,it is a process of findingmodel and the relationship of the data in a large amount of data by analytical tools.Clustering analytical
is an important component of data mining technology.Data clustering mining technology is an emerging area which involves various areas·
FCM(Fuzzy c.means)algorithm,as a kind of unsupervised learning methods,it is a research hotspot concerning about data clustering analytical technology.FCM is one of important algorithm in data clustering mining methods.it has the characteristics as simple,fast converg
您可能关注的文档
- 基于全局优化搜索的良好密码特性布尔函数构造策略-计算机软件与理论专业论文.docx
- 基于视觉和几何特征的街景图像语义分割-通信与信息系统专业论文.docx
- 基于网络DNC的车间级信息集成设计与研究-机械电子工程专业论文.docx
- 基于全阶滑模观测器的IPMSM无位置传感器控制策略分析-电力电子与电力传动专业论文.docx
- 基于网络管理数据库中性能数据的知识发现(KDD)研究-计算机软件与理论专业论文.docx
- 基于企业内外部网络视角的创新绩效多因素影响模型与实证研究-管理科学与工程专业论文.docx
- 基于统计学习理论的支持向量机分类方法研究-信号与信息处理专业论文.docx
- 基于历史文物建筑保护“原真性”原则的成都市金牛宾馆张大千故居修缮研究-建筑与土木工程专业论文.docx
- 基于图象技术的一次性输液针检测软件原型系统-化工过程机械专业论文.docx
- 基于矢量有限元法的光纤光场分布研究-电磁场与微波技术专业论文.docx
- 统编版2025年春季新版七年级下册历史 第21课 明清时期的科技与文化 教案.docx
- 雅安雨城法院书记员招聘考试真题库2025.docx
- 2026届安徽合肥市高考一模高考语文试卷试题(含答案详解).pdf
- 【专题研究】国内外城市更新研究的最新进展.pdf
- 【专题研究】老旧城区改造居民满意度影响因素研究——以遂宁市老旧城区改造为例.pdf
- 【专题研究】关于旧城空间改造理论与创意设计案例的几点思考.pdf
- 西藏拉萨市高三下学期期末物理备考重点详解.docx
- 泾县法院书记员招聘笔试真题2025.pdf
- 2026年春【苏教版】-六年级数学下册-面积的变化.pptx
- 2026年春【苏教版】-六年级数学下册-7.pptx
最近下载
- 2025年辽宁省文物博物初、中级专业技术资格考试历年参考题库含答案详解.docx VIP
- PLC实现的台车呼叫控制系统.pdf VIP
- 2025年辽宁省文物博物初、中级专业技术资格考试历年参考题库含答案详解(5卷).docx VIP
- 2025年辽宁省文物博物初、中级专业技术资格考试历年参考题库含答案详解.docx VIP
- 2026中国跨境电商物流体系优化与成本控制策略研究报告.docx
- 消防工程三措一方案(3篇).docx VIP
- 鱼我所欲也原文.docx VIP
- 计算机应用基础(Windows10+WPSOffice)教学教案.docx VIP
- 2025年贵州省中考语文试卷真题(含答案详解).docx
- 第2次超级机器人大战Z 再世篇.pdf VIP
原创力文档

文档评论(0)