- 8
- 0
- 约2.15万字
- 约 5页
- 2018-08-18 发布于天津
- 举报
基于模拟退火优化双聚类的基因数据填补方法-计算机应用与软件
第34卷第11期 计算机应用与软件 Vol34No.11
2017年11月 ComputerApplicationsandSoftware Nov.2017
基于模拟退火优化双聚类的基因数据填补方法
1 1 2 1
朱 娴 杨 明 马 卫 朱 俊
1(南京理工大学紫金学院计算机学院 江苏南京210046)
2(南京旅游职业学院酒店管理学院 江苏南京211100)
摘 要 基因表达数据是由DNA微阵列实验产生的大规模矩阵,能有效地提取生物学信息,由于受到实验条
件限制,基因表达数据往往存在缺失值,需要进行缺失数据的填补。传统的缺失数据填补方法是基于基因表达数
据的单一特征,未充分考虑数据矩阵间的相关性。针对双聚类均方残值越小基因表达数据相关性越高这一特性
进行研究,提出一种基于模拟退火优化双聚类的缺失数据填补方法(biSA),采用模拟退火法确定最优双聚类,从
而实现缺失数据的最有效填补。四组真实基因表达数据实验表明,biSA方法能够获得较高的填补准确性。
关键词 基因表达数据 缺失数据填补 模拟退火法 双聚类
中图分类号 TP391.9 文献标识码 A DOI:10.3969/j.issn.1000386x.2017.11.046
GENEDATAIMPUTATIONMETHODBASEDONSIMULATE
ANNEALINGOPTIMIZEDBICLUSTERING
1 1 2 1
ZhuXian YangMing MaWei ZhuJun
1(DepartmentofComputerScience,ZijinCollege,NanjingUniversityofScienceandTechnology,Nanjing210046,Jiangsu,China)
2(SchoolofHotelManagement,NanjingInstituteofTourismandHospitality,Nanjing211100,Jiangsu,China)
Abstract GeneexpressiondataaregeneratedfromtheDNAmicroarrayexperimentsoflargedatamatrix,whichcan
effectivelyextractthebiologicalinformation.Duetothelimitationofexperimentalconditions,geneexpressiondatais
oftenthepresenceofmissingvaluesandneedtofillthemissingdata.Thetraditionalmissingdataimputationmethodis
basedonthesinglefeatureofthegeneexpressiondata,andthecorrelationbetweenthedatamatrixisnotconsidered.
Thesmallerthemeansquareresidueofthedualclusteringis,thehigherthecorrelationbetweenthedataofthegene
expressiondatais,andamethodofmissingdatafilling(biSA)basedonsimulatedannealingoptimizeddouble
clusteringisproposed.Thismissingdataimputationmethodusedsimulatedannealingtooptimizetheoptimal
biclustering,andthusachievedthemosteffectiveimputationofmissingdata.Fou
原创力文档

文档评论(0)