一种基于广义相似性的共调控基因聚类算法.pdfVIP

  • 12
  • 0
  • 约1.42万字
  • 约 4页
  • 2017-09-13 发布于湖北
  • 举报

一种基于广义相似性的共调控基因聚类算法.pdf

第30卷第1l期 东 北 大 学 学 报 ( 自 然 科 学 版 ) Vo1.30.No.1l 2009年 11月 JournalofNortheasternUniversity(NaturaIScience) Nov. 2009 一 种基于广义相似性的共调控基因聚类算法 赵宇海 一,乔百友 一,林天亮 ,王国仁1,2 (1.东北大学 医学影像计算教育部重点实验室,辽宁 沈阳 110004: 2.东北大学 信息科学与工程学院,辽宁 沈阳 110004; 3.东北大学 计算 中心,辽宁 沈阳 110004) 摘 要:针对共调控基因的特殊性质和现有共调控基因聚类算法存在的不足,提出了基于广义相似性的 聚类模型g—Cluster.正负共调控基因因具有相同的编码而被聚集到同一个共调控基因簇中.进一步提出了一 种基于树结构的聚类算法FBTD,采用先宽度优先后深度优先的搜索策略,挖掘所有符合条件的最大 譬一 Cluster,同时应用了高效的削减规则和优化策略.将该算法用于真实数据集.理论分析和实验结果都表明,该 算法是实用和有效的. 关 键 词:共调控基因;聚类;模式相似性;基因本体 中图分类号:TP311.13 文献标识码 :A 文章编号:1005—3026(2009)11-1558—04 A ClusteringAlgorithm BasedonGeneralizedSim ilarityforCo- regulatedGenes ZHAO Yu—hai~,QIAOBai-you-,L Tian—liang ,WANGCruo-ren , (1.KeyLaboratoryofMedicalImageComputing,MinistryofEducation,NortheasternUniversity,Shenyang 110004,China;2.SchoolofInformation Science Engineering,NortheasternUniversity,Shenyang 110004, China;3.ComputerCenter,Northeastern University,Shenyang110004,China.Correspondent:ZHAO Yu—hai, E—mail:zhaoyuhai@ ise.neu.edu.cn) Abstract:A novelclusteringmodel,i.e.,theg—Cluster,isdevelopedonthebasisofgeneralized similarityforthespeeialpropertiesand disadvantagesofexistingclusteringalgorithmsofco— regulatedgenes.Thepositiveandnegativeco-regulatedgenesinthismodelareintegratedintothe 8meclusterifandonlyiftheyareprovidedwiththesamecode.Further,atree—basedclustering algoritmh FBTD(firstbreadththendepth)isproposed,wheretheprioritiesinsearchstrategyis thatthebreadthistakenfirstthenthedepth,tofindoutallthemaximalg—Clusterswithhigh— efficiencypruningrulesandoptimizingstrategyperformedsimultaneously.ApplyingtheFBTD algoritmh torealdatasetsinvolvinggenes,boththetheoreticandtestingresultsshowedthatthe algorithm ispracticallyefficient.

文档评论(0)

1亿VIP精品文档

相关文档