基于加权打分疾病数据库整合方法.docVIP

  • 7
  • 0
  • 约6.79千字
  • 约 11页
  • 2017-11-07 发布于福建
  • 举报
基于加权打分疾病数据库整合方法

基于加权打分疾病数据库整合方法   摘 要:生物信息学数据库记录了多种类型的基因组分析成果,其中疾病相关数据库记录了与疾病有关的基因组信息。由于疾病数据库在内容和结构上存在较大差异,疾病相关数据无法整合到一起,给后续研究工作带来不便。制定了五条标准筛选出疾病相关数据库,通过扩展GFF3创建新的文件格式GDF对这些异构数据库进行转化融合。通过对记录信息进行加权打分,得分高低表示该条记录的可信程度,然后将文件加载到分析工具中,丰富知识展示体系,给研究者提供全面、便捷的参考。 关键词:数据库整合;加权打分;生物信息学 中图分类号: TP39 文献标识码:A 文章编号:2095-2163(2013)04- A Method for Integration of Disease-related Databases and Genome Browser based on Scoring WANG Zhenxing,WANG Yadong (School of Computer Science and Technology, Harbin Institute of Technology, Harbin 150001, China) Abstract:The bioinformatics databases store multiple types of genomic analysis results, including disease-related database recording genomic information related with diseases. But there are differences of contents and composition among them and that brings inconvenience in further research. This paper formulates five standards to filter out disease-related databases and then integrates them by GDF format which is created by extending the GFF3 format. The record is scored by weighting the factors and the score represented the credibility of the record. The paper loads the GDF files into data analyzer and forms an abundant knowledge system providing comprehensive and convenient reference to researchers. Key words: Database Integration; Weighted Scoring; Bioinformatics 0 引言 新一代测序技术的不断发展以及测序费用的不断降低,加之千人基因组计划的强势推动,个人基因组数据如潮涌般大规模出现,各类生物信息学数据库也随之大量增加。很多数据库同时包含序列、结构以及遗传变异位点、疾病相关信息等注释。新一代测序技术催生出的一大批高通量数据和芯片数据正迫切需要建立数据库,对其进行有效管理,由此对于个人基因组数据的分析即成为重中之重,以及当务之急。 很多数据库正在将基因组学从实验运用到实际应用中,即利用基因组数据对人类疾病进行更加深入的理解和更加有效的治疗。与疾病紧密相关的药物也在生物信息学及计算机辅助设计的作用下获得了新的发展。例如Online Mendelian Inheritance In Man(OMIM)[1]是一个全面、权威、且更新迅速及时的有关人类基因和遗传疾病的知识库,其纸质版自1966年以来已经印制了12版,记录了每条染色体上与特定基因相关的遗传位点和疾病等信息;GAD[2]则收集已发表过的人类遗传关联研究成果,提供一个全面公开的有关分子和临床的数据库,数据量要远大于OMIM;GWASdb[3]收集与人类疾病有关的遗传变异位点数据,包括基因组映射信息、调控影响、氨基酸的改变、基因表达以及疾病关联等;PharmGKB[4]则记录了包括遗传变异、基因、蛋白质与药理学信息、疾病的关系等数据。 很多的数据分析工具并不支持疾病药物相关数据的整体浏览,原因是这些数据库之间记录的信息和描述模式不尽相同,没有一个统一的文件格式整合存储这些数据。研究者想要查看疾病相关数据就需要登陆不同的在线数据库依

文档评论(0)

1亿VIP精品文档

相关文档