生物医学大数据发展的新挑战与趋势.pdfVIP

  • 29
  • 0
  • 约2.45万字
  • 约 8页
  • 2019-11-20 发布于天津
  • 举报

生物医学大数据发展的新挑战与趋势.pdf

学科与领域 Subject and Field 生物医学大数据发展的 新挑战与趋势 1,2* 1,2* 1 1 张国庆 李亦学 王泽峰 赵国屏 1 中国科学院计算生物学重点实验室生物医学大数据中心,中国科学院-马普学会计算生物学伙伴研究所, 中国科学院上海生命科学研究院(上海营养与健康研究院),中国科学院大学 上海 200031 2 上海生物信息技术研究中心 上海 201203 摘要 生物医学数据从PB 量级的组学时代进入到 EB 量级的多维度大数据时代,引发了生物医学研究向数据密集型 的第四科学范式的深刻变革。如何将临床数据与研究数据进行高维度多层次的汇交共享,实现从“组学”到临床 与健康人群数据的生物医学大数据的综合管理利用,从而使大数据迅速转化为新知识,成为生物医学大数据所面 临的挑战。发展以递交为基础、以整合为导向的数据存储技术,以主题为基础、以交互为导向的数据共享技术, 以及以传统信息技术为基础、以前沿信息技术为导向的数据分析挖掘技术,并同时开展标准质控相关研究,是生 物医学大数据存储、共享和转化的新思路,也是构建新一代生物医学大数据研究中心的技术关键和未来趋势。 关键词 生物医学,大数据,整合,交互,数据挖掘 DOI 10.16418/j.issn.1000-3045.2018.08.013 人类基因组计划启动以来,以新一代测序技术和质 物医学数据从以基因组为代表的PB 量级时代推升到多组 谱技术为代表的各类组学技术的飞速发展,推动了基因 学融合的EB 量级时代。另一方面,人群队列研究、分子 组、转录组、表观遗传组、蛋白质组、代谢组等海量生 流行病学研究产生了大量长时间、广空间的数据,表型 [1,2] 命科学组学数据的指数级的增长 。一方面,机器学习 组从分子、细胞、组织、器官、个体等多层面描述了高 和人工智能技术极大提升了医学影像和分子影像技术的 维数据,真实世界数据(real world data )回顾性地汇总 [3,4] 分析能力,正在改变以影像组、放射组为代表的医学影 分析海量的临床信息数据 ,这些数据构成了复杂的高 像数据的应用方式。高通量实验技术的突破,直接把生 维度生物医学大数据。 *通讯作者 资助项目:国家重点研发计划精准医学专项(2017YFC0907505、2017YFC0908405、2016YFC0901904、2016YFC0901604),中国科学院重 点部署项目(ZD-SW-219) 修改稿收到日期:2018年8 月12 日 院刊 853 学科与领域 我们已经进入了具备相当深度和广度的生物医学大 DNA 数据库(DDBJ )。这三大数据中心经过近 3 0年的建 数据时代。生物医学临床数据呈现数量巨大、增长迅速、 设,已经形成了完备的数据汇交技术体系,在基因组、 [5-11] 质量控制困难、来源广泛繁杂、难以标准化与结构化等特 转录组、蛋白质组等领域发挥着重要影响力 。国内机 点,生物医学研究数据呈现种类繁多、内部结构高维复 构也已经开始按照数据类型建设了

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档