- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于人工免疫系统的蛋白质相互作用网络聚类算法.doc
基于人工免疫系统的蛋白质相互作用网络聚类算法 摘要:提出了一种基于人工免疫特性的蛋白质相互作用(PPI)网络聚类模型与算法以期提高其辨识准确率在该算法中将聚类中心作为抗原,将邻接的节点作为抗体,通过计算抗体与抗原之间的亲和度,将其作为记忆细胞把节点划分到聚类中;然后选择优秀抗体作为疫苗,尝试将疫苗注入聚类模块并进行更新,通过与注射前的模块适应度进行比较,不断更新记忆细胞对PPI数据集上的数据进行了仿真,实验结果表明,与功能流算法(FLOW)相比,所提方法的正确率和查全率的几何平均值均得到了提高 关键词:人工免疫系统; 蛋白质相互作用网络; 聚类; 记忆细胞; 疫苗 中图分类号: TP391.4 文献标志码:A 0引言 随着人们对蛋白质相互作用(ProteinProtein Interaction,PPI)网络的深入研究,发现PPI网络是一种具有庞大数据量的复杂网络,同时还具有无尺度[1]和小世界[2]的特性,其内部是由大量的高密度复杂节点与一些稀疏的连接节点组成的蛋白质之间相互关联,在某个特定的时间组成了某种特定功能的蛋白质复合物,这在PPI网络中就是一些高度相关的子网而我们对PPI网络进行分析的一个主要目的,就是识别与分析细胞环境中生物分子的相互作用[3-4],利用数据挖掘中的聚类分析方法从中找到具有特定功能的蛋白质功能模块[5] 人工免疫系统(Artificial Immune System,AIS)是根据免疫系统的功能、原理和模型开发的,能仿效生物复杂的免疫系统过程来解决复杂的工程问题AIS仿效生物免疫调节过程,将抗原对应于待解决的问题,抗体对应于问题的最优解,记忆细胞对应于当前保留的优化解;并通过抗原与抗体之间的相互促进、抑制和整个免疫系统的自我调节特征,以及利用免疫记忆细胞系统、免疫疫苗等机制,不断寻找问题的最优解目前,已开发出应用于不同领域的免疫算法,如一般免疫算法[6]、免疫疫苗算法[7]等针对传统聚类方法过度依赖聚类数据原型的缺点,李洁等[8]利用免疫算法良好的随机搜索与全局搜索能力提出了一种基于免疫进化计算的数值数据聚类算法 根据PPI网络的拓扑特征,本文将免疫记忆特性[9]及免疫疫苗[7]应用于PPI网络的聚类过程中,提出了基于人工免疫系统的PPI网络聚类算法(Clustering Proteinprotein interaction networks based on Artificial Immune System, CPAIS)首先介绍了人工免疫系统的基本原理以及寻优过程中需要用到的目标函数;然后将PPI网络聚类模型中的聚类中心对应于抗原,待聚类节点对应于抗体,由抗原与抗体之间的亲和度[10-11]构造聚类模块的适应度函数,在基于免疫记忆细胞机制的基础上,通过接种疫苗的方式重新选择群体中的优秀个体迁移到模块中,从而不断提高整个模块的适应度,如果疫苗接种后适应度降低,则取消接种;最后通过合并相似模块的方式,得到全局聚类结果通过仿真实验来得到在PPI网络数据集上的聚类结果,在对功能流算法[12]进行仿真结果的分析比较后表明算法的正确率和稳定性得到了提升 1相关概念及原理 1.1数据预处理 在PPI网络中,节点之间的特征主要是由节点的度和节点间相互作用的权值来体现据此,为了提高算法运行效率,先对蛋白质节点用数字进行编号,然后将整个待聚类数据用邻接矩阵的结构进行存储任意两个节点i,j间的连接强度用weight(i,j)来表示 1.2亲和度(层次距离)的计算 在PPI网络中,各个节点之间不仅体现出直接连接的关系,在聚类模块中还体现出一种中心到节点的层次关系,也就是说在一个聚类模块里从聚类中心到某个节点之间的距离不但要体现出所经过路径上的权值,还应该体现出层次的关系本文定义一种层次距离来体现这种特点并对应免疫算法中的亲和度: 1.3目标函数(模块适应度)的计算 PPI网络中节点之间的边反映了节点与节点之间存在的连接关系模块的聚集系数[13]是指该模块中与所有节点实际存在的边的数目与可能存在的边的数目的比例,反映了该模块节点间的聚集程度,用公式表示如下: 1.4注射疫苗 在聚类的局部过程中,各聚类中心对应的每一层的初次聚类行为完成后,根据上一次产生的聚类结果形成先验知识[15],将剩余的未被访问节点中度最高并且大于当前记忆细胞库的节点度平均值的优秀个体作为疫苗,并注射到聚类模块中以提高整个模块的内聚程度最后根据疫苗注射后的模块适应度变化情况决定是否接种,如果适应度提高,则确定该次接种,将疫苗注入当前聚类模块,否则取消该次接种行为 1.5聚类中心的初始化 对邻接矩阵使用式(3)计算各节点聚集系数并进行排序,然后将前cenNum个节点作为抗原,也就是初始聚类中心在初始聚类中心选择的过程中,各个节点(抗体)所对应的聚类中
文档评论(0)