- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于聚類入侵检测的一种遗传算法
基于聚类入侵检测的遗传算法
XX(姓名)
(XX大学 xxx班 (学号)xxxxx)
摘要:随着互联网的迅速发展,许多新的技术被引入到网络安全领域。人工智能和入侵检测技术的结合,将克服入侵检测系统的一些缺点,同时对人工智能技术本身也有很大的推动力。介绍了在入侵检测系统中出现的主要人工智能技术,并讨论了其在入侵检测系统中所起的作用。数据挖掘是一种通用人工智能的技术,它是从大量的数据中提取人们感兴趣的模式的过程。将数据挖掘技术应用到网络安全当中,建立网络入侵检测系统模型,是数据挖掘技术应用的一个新领域。讨论入侵检测系统的基本技术,探讨基于智能技术的入侵检测方法,提出基于聚类算法的入侵检测系统。在利用聚类进行入侵检测的方法中,有效地进行聚类是关键。为了对未标识数据进行聚类,提出了一种新的无监督入侵检测方法。该方法克服了聚类算法中对数据输入顺序敏感和需要预设聚类数目的缺点,减少了所需参数个数。通过初始聚类簇的建立和混合遗传算法对初始聚类进行优化组合两阶段的方法来实现聚类,克服了初始聚类对结果的影响,提高了聚类质量,并进行检测入侵。
关键词:聚类 聚类算法 遗传算法 入侵检测
0、引言
数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘更广义的说法是川数据挖掘意味着在一些事实或观察数据的集合中寻找模式的决策支持过程。人们把原始数据看作是形成知识的源泉,就像从矿石中采矿一样。原始数据可以是结构化的,如关系数据库中的数据,也可以是半结构化的,,如文本、图形、图像数据,甚至是分布在网络上的异构型数据。发现知识的方法可以是数学的,也可以是非数学的可以是演绎的,也可以是归纳的。发现了的知识可以被用于信息管理、查询优化、决策支持、过程控制等,还可以用于数据自身的维护。因此,数据挖掘是一门广义的交叉学科,它汇聚了不同领域的研究者,尤其是数据库、人工智能、数理统计、可视化、并行计算等方面的学者和工程技术人员都投入很大的精力和人力进行研究,并取得了可喜的成果。
聚类是数据挖掘的一个重要内容和基本形式之一,聚类通过比较数据的相似性和差异性,能发现数据的内在特征及分布规律,从而获得对数据更深刻的理解与认识,所以聚类的挖掘技术受到了科技界的广泛关注目前的聚类算法大都是适用于数值属性或符号属性中的一种,而我们研制的一种基于遗传算法的聚类新方法, 可以对包含数值属性和符号属性。
1、聚类算法
(1) 层次聚类算法
层次聚类是对给定的数据对象的集合进行层次的分界,根据一些指定标准把数据排列成一个树状结构的算法。根据层次分界的表示方式,层次聚类方法又可以分为凝聚的和分裂的两种。凝聚算法先将每个数据作为一个簇,然后根据一定的规则将簇合并,凝聚算法又有单连接(single linkage)、全连接(complete linkage)和平均连接(average linkage)方法.单连接是指当两个簇之间存在互连的边,并且簇中数据最小距离小于等于给定的阈值,则认为这两个簇的距离足够小,可以合并。全连接和单连接类似,不过全连接是使用簇中数据的最大距离作为簇间距离。平均连接使用两簇中数据的两两距离的平均值作为簇间距离。分裂聚类先将所有数据归在一个簇里,然后对簇中联系不紧密的数据进行分裂,分到其他簇里,分裂聚类有一些简化的算法,如单元分裂法和多元分裂法。单元分裂法每一次选取一个变量对簇进行分裂,和变量相同的数据归为一类,和变量不同的数据归为另一类。多元分裂则是选取一个距离其他数据最远的数据构成分离组,然后计算簇中每一个数据距离分离组的距离并和该数据与簇中其他数据的距离进行比较,若该数据距离分离组的距离更近,则将该数据划入分离组。重复这个过程,直到找不到这样的数据为止。
(2) 分割聚类算法
分割聚类法先对所有数据点进行较为粗略的划分,然后通过重复的迭代算法使某个准则达到最优化来对划分进行修正。分割聚类法又可以分为基于密度的算法,基于网格的算法,基于图论的算法,基于平方误差的迭代重分配算法基于密度的聚类的主要思想是根据数据对象的分布密度,将密度足够大的数据对象聚集成一类。该类算法基于样本的邻域条件,整个样本空间被低密度区间划分开,且不需要预先知道聚类的数目,只需一遍扫描就可以完成聚类的任务。基于网格的聚类将数据空间分成有限数目的小空间以构成一个可以聚类的网格结构,所有操作都在这些小空间中进行。和基于密度的聚类只能处理数值型数据不同,基于网格的聚类可以处理任意类型的数据。基于网格的聚类需要考虑如何选择小空间的大小和数目以及如何对小空间中的信息进行汇总。基于图论的聚类是把聚类问题映射为一个图论中的组合优化问题。例如,基于图论聚类中的谱聚类算法就是首先根据给定的样本数据集定义一个
您可能关注的文档
最近下载
- (11)--1.2.1 植物细胞的繁殖-有丝分裂.ppt VIP
- 2025年招生和对口招生文化素质测试数学试题及参考答案 完整版912.pdf VIP
- 广东省广州第六中学2024-2025学年高一上学期期中考试化学试题.docx VIP
- 大学物理1-1质点运动的描述.pptx VIP
- 征途漫漫,唯有奋斗——博物馆里的抗战教育:中国人民抗日战争纪念馆.pptx VIP
- 中国机长观后感中国机长观后感范文.pdf VIP
- 2024年浙江省温州市《保安员证》考试题库含答案统编版 .pdf VIP
- 管理心理学:理论与实践.pptx
- 课题申报书:基于生成式人工智能的医学教育创新融合途径研究.docx VIP
- 面向人工智能应用的语料数据生态构建与治理研究.docx VIP
文档评论(0)