基于模拟退火优化双聚类的基因数据填补方法-计算机应用与软件.PDFVIP

  • 8
  • 0
  • 约2.15万字
  • 约 5页
  • 2018-08-18 发布于天津
  • 举报

基于模拟退火优化双聚类的基因数据填补方法-计算机应用与软件.PDF

基于模拟退火优化双聚类的基因数据填补方法-计算机应用与软件

第34卷第11期    计算机应用与软件 Vol34No.11 2017年11月   ComputerApplicationsandSoftware Nov.2017 基于模拟退火优化双聚类的基因数据填补方法 1 1 2 1 朱 娴  杨 明 马 卫  朱 俊 1(南京理工大学紫金学院计算机学院 江苏南京210046) 2(南京旅游职业学院酒店管理学院 江苏南京211100) 摘 要  基因表达数据是由DNA微阵列实验产生的大规模矩阵,能有效地提取生物学信息,由于受到实验条 件限制,基因表达数据往往存在缺失值,需要进行缺失数据的填补。传统的缺失数据填补方法是基于基因表达数 据的单一特征,未充分考虑数据矩阵间的相关性。针对双聚类均方残值越小基因表达数据相关性越高这一特性 进行研究,提出一种基于模拟退火优化双聚类的缺失数据填补方法(biSA),采用模拟退火法确定最优双聚类,从 而实现缺失数据的最有效填补。四组真实基因表达数据实验表明,biSA方法能够获得较高的填补准确性。 关键词  基因表达数据 缺失数据填补 模拟退火法 双聚类 中图分类号 TP391.9    文献标识码 A    DOI:10.3969/j.issn.1000386x.2017.11.046 GENEDATAIMPUTATIONMETHODBASEDONSIMULATE ANNEALINGOPTIMIZEDBICLUSTERING 1 1 2 1 ZhuXian YangMing MaWei ZhuJun 1(DepartmentofComputerScience,ZijinCollege,NanjingUniversityofScienceandTechnology,Nanjing210046,Jiangsu,China) 2(SchoolofHotelManagement,NanjingInstituteofTourismandHospitality,Nanjing211100,Jiangsu,China) Abstract  GeneexpressiondataaregeneratedfromtheDNAmicroarrayexperimentsoflargedatamatrix,whichcan effectivelyextractthebiologicalinformation.Duetothelimitationofexperimentalconditions,geneexpressiondatais oftenthepresenceofmissingvaluesandneedtofillthemissingdata.Thetraditionalmissingdataimputationmethodis basedonthesinglefeatureofthegeneexpressiondata,andthecorrelationbetweenthedatamatrixisnotconsidered. Thesmallerthemeansquareresidueofthedualclusteringis,thehigherthecorrelationbetweenthedataofthegene expressiondatais,andamethodofmissingdatafilling(biSA)basedonsimulatedannealingoptimizeddouble clusteringisproposed.Thismissingdataimputationmethodusedsimulatedannealingtooptimizetheoptimal biclustering,andthusachievedthemosteffectiveimputationofmissingdata.Fou

文档评论(0)

1亿VIP精品文档

相关文档