- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于有限资源人工免疫系统K中心点聚类算法
基于有限资源人工免疫系统K中心点聚类算法
[摘要]:文章提出了一种基于有限资源人工免疫系统的K-中心点聚类算法,把K-中心点聚类算法生成的簇看作有限资源人工免疫系统(RLAIS)中的人工识别球(ARB),通过免疫学习获得全局最优解。该算法是可行的、有效的。
[关键词]:有限资源人工免疫系统(RLAIS);K-中心点聚类;人工识别球(ARB)
中图分类号:TP2 文献标识码:A 文章编号:1002-6908(2007)121
引言:
人工免疫系统是一类基于生物免疫系统的功能、原理、基本特征以及相关理论免疫学说而建立的用于解决各种复杂问题的计算系统,旨在通过深入探索生物免疫系统所蕴含的信息处理机制,建立相应的工程模型和算法,开拓新型智能信息处理系统[1][2]。
随着社会各个方面的飞速发展,人们积累了大量的信息数据。为了从这些海量的数据中提取出有用的信息,找出各种数据之间的关系,一种新的信息技术迅速发展起来,这就是数据挖据(DataMining)技术。聚类(Clustering)分析是数据挖掘中一种重要技术,通过数据建模进行数据简化。是数据挖掘技术中一种重要的方法。聚类将数据集划分为若干个簇,并使得同一个簇内的数据对象具有较高的相似度,而不同簇中的数据具有较大的相异度。
文章提出了一个基于有限资源人工免疫系统的K-中心点聚类方法,对该算法的运算过程作了详细的说明。该算法即融合了K-中心点算法的优点,也吸收了RLAIS的各种好处,极大地提高了数据聚类的效率。
1.有限资源人工免疫系统(RLAIS)
1.1AIS的仿生机制[3]
AIS是从生物免疫系统启发而来的,其仿生机制包括免疫识别、免疫学习、免疫记忆、克隆选择和个体多样性等。免疫识别是AIS的核心之一,本质是区分非我和自我。对于非我免疫识别是通过淋巴细胞上的抗原识别受体与抗原的结合实现的,结合的强度称为亲和度。相应地,AIS中的抗原识别通过特征匹配来实现,其核心是定义一个匹配阈值,而对匹配的度量可采用多种方法。免疫识别过程同时也是一个学习的过程,学习的结果是,免疫细胞的个体亲和度提高、群体规模扩大,并且最优个体以免疫记忆的形式得到保存。
1.2有限资源人工免疫系统(RLAIS)
当免疫外部潜在抗原的数量远大于免疫系统蛋白质的种类,为实现对抗原的有效识别,需要有效的多样性个体产生机制。为此,识别球的概念被提出[4]:免疫系统的特定体积V内包含了许多抗体结合部(paratopes)和抗原决定基(epitopes),每一抗体(或抗体结合部)外有一个环绕区域,称为识别球,见图1。在这个识别球内,一个抗体可以识别所有的抗原,这样有限的抗体就可以识别无限的抗原。
Timmis于1999年在Hunt和Ccooke等人提出的人工免疫系统数据分析方法的基础上,提出可视化有限资源人工免疫系统(RLAIS)[5]。
该模型引入人工识别球概念(Artificial Recoginaztion Ball,ARB)。一个ARB表示许多同样的B细胞。在该系统中,不再表示个体B细胞。RLAIS允许包含事先定义的B细胞,RLAIS必须为了基于它们的刺激水平而竞争。刺激水平越高,ARB就可以拥有更多的B细胞,反之亦然。如果ARB失去所有的B细胞,认为不再表示要学习的数据而从网络清除。B细胞分配的竞争稳定了网络结构。稳定作用可以描述为由于RLAIS的强大模式识别能力,以及无论训练数据提交给RLAIS多少次,表示法都不变。
RLAIS由一组ARB和它们之间的联系组成,表示相似性。ARBs 在RLAIS内竞争表示许多B细胞的能力。在学习循环开始,由于在AIS中,克隆和变异机制用于创造训练数据的多样性,所以B细胞数目有限。
训练数据不断提交给网络。模型算法或者一旦网络稳定下来被一个特殊终止条件终止,或者能够继续无限学习。以前没见过的数据能够提交给网络继续学习过程,新数据可以融合进网络。假设原始数据也被用于训练,则数据中的原始簇会保留,新的数据簇会出现[6]。
在RLAIS中,一个模式被辨识出来,网络不衰退也不失去模型,不仅可用于一次性簇学习,而且表现出连续学习的能力。
在RLAIS内,产生有限数目的B细胞,否则只有B细胞。很明显,B细胞指数级增长是不能持续的;因此推断免疫系统内的资源是有限的,这种限制导致B细胞之间的竞争,受刺激的最强的B细胞才能存活。这种认识思想和超动态性是RLAIS模型的思想基础。
2.K-中心点聚类算法[7]
k-中心点聚类算法的基本策略是:首先选择K个对象作为初始的K个簇的代表点,剩余的对象根据其与代表点对象的距离分配给最近的一个簇。然后反复地用非代表点来
文档评论(0)