药物分子设计中的大数据问题 - 生物通.pdfVIP

  • 35
  • 0
  • 约2.8万字
  • 约 8页
  • 2017-09-02 发布于天津
  • 举报

药物分子设计中的大数据问题 - 生物通.pdf

药物分子设计中的大数据问题 - 生物通

2015 年 第 60 卷 第 5-6 期:558 ~ 565 《中国科学》杂志社 专辑: 大数据研究与应用 评 述 SCIENCE CHINA PRESS 药物分子设计中的大数据问题 ① ① ① ① ② ① ①②* 严鑫 , 丁鹏 , 刘志红 , 王领 , 廖晨钟 , 顾琼 , 徐峻 ① 中山大学药学院药物分子设计与生物超算中心, 广州 510006; ② 合肥工业大学医学工程学院, 合肥 230009 * 联系人, E-mail: junxu@ 2014-11-11 收稿, 2014-12-01 接受, 2015-01-09 网络版发表 国家自然科学基金、国家高技术研究发展计划(2012AA020307)、广东省引进创新科研团队专项计划(2009010058)、广州超级计 算应用研发与扶持专项(2012Y2-00048)和中央高校基本科研业务费专项(2013HGCH0015)资助 摘要 药物创新领域的大数据主要来源于高通量实验、高效能模拟计算、信息化、科技出版物 关键词 和专利文献4个方面. 这些大数据使我们有可能在系统层面上看到药物分子与许多靶标相互作用 大数据 的新现象、新规律, 提高药物创新的效率, 也带来新的挑战, 如存储、标引/标注和质控、可视化、 药物设计 数据挖掘和计算复杂度等问题. 这些问题可以通过在超算和云服务技术的支持下发展并行计算 生物信息学 化学信息学 方法而逐渐得到解决. 从离散、不完备且信噪比低的大数据中难以找到物质活性与结构之间的连 高性能计算 续函数关系, 贝叶斯学习机及其与支持向量机、决策树技术的组合是大数据挖掘的发展方向. 大 数据既是科学实验通量化和社会信息化的结果又是原因, 正确解决大数据挖掘问题是提高药物 创新效率的核心. 1 用于生物医药研究的大数据来源 科学领域引发了以“高通量”为主要特征的科技革命, 它对药物创新的影响主要表现在下述几个方面. 大数据(big data)近年来引起生物医药研究人员 [1] ( ⅰ) 在靶标研究方面. DNA 的体外扩增技术 的广泛关注 , 大数据的特点已有很多综述和讨 使人类基因组计划提前完成, 触发了各种组学研究, 论[2~4]. 药物分子设计领域涉及的大数据因为与生物 [9] 据报道, 以“组学”冠名的各种研究已达3000多种 , 大分子及小分子结构与性质相关, 其来源、数据挖掘 每种组学研究都涉及大量的数据. 例如, 基因组 的需求都有自己的特殊性, 需要特殊技术进行处理. (genome) 依赖于DNA 测序技术; 转录组(transcri- 生物医药创新活动涉及设计、制备/提取、筛选/ ptome)依赖于微芯技术; 蛋白组(proteome)和代谢组 测试各种生物分子材料. 为了设计、制备和测试药物 (metabolome) 依赖于高分辨率质谱技术; 表型组 分

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档