应对生命科学的大数据挑战.pdfVIP

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
应对生命科学的大数据挑战

第 8 卷  第 6 期  2012 年 6 月 应对生命科学的大数据挑战 王丙强 邱 爽 郭贵鑫 叶志强 关键词 :生命科学 基因 大数据挑战 异构计算 华大基因 生命是怎样构成和如何繁衍的?从达尔文的生 进一个新的领域:人们将可能通过评估个人的基因 物进化论到孟德尔遗传定律的发现,再到1953年沃 组或遗传数据来定制疾病治疗方案和用药策略,即 森和克里克提出DNA双螺旋结构,人类对生命科学 个性化医疗。 的研究经历了从宏观到微观的过程。今天,我们已 伴随着基因组研究在疾病的诊疗方面的应用, 经能从分子的层次来观察生命的构成,并且知道如 基因组测序也正从广度向深度发展。不同组织、不 果将一个人的23对染色体展开,可以得到长达2米 同器官、从DNA 、RNA到蛋白质序列的测序结果和 的DNA序列。这些DNA 由30亿个脱氧核苷酸碱基对 分析,将为全面揭示疾病的生物学机制奠定重要基 构成,由它们编码的约3万个基因决定着每个人的 础。在另一个层面上,一个个体的基因组信息更新 性状特征。 也是随时间变化的动态过程。在不远的将来,我们 200 1年,随着人类基因组草图的发表,很多专 将可以分离单细胞并对其测序,可以实时监控单分 家预测DNA测序技术的发展将随之结束。然而,情 子的活动,并通过降低产生这些数据的花费,对数 况恰恰相反,DNA测序技术的应用已经逐渐拓展到 百万个个体建立档案存储相关信息。与此同时,生 多种生物。测序技术也发生着革命性的变化。 物分子育种和农业生产的需求,也推动着多样本测 基因组测序的不断深入使人们对不同个体之间 序和群体基因组分析的发展。通过对上千种动植物 的差异性有了进一步的认识。早先,不同个体之间 进行de novo 基因组测序和百万动植物样本进行重测 单核苷酸多态性估计约为0.1%[1,2] ,而2007年发表的 序,我们可以构建包含丰富遗传信息的数据库,研 第一个人类双倍体基因组 (HuRef genome )显示, 究生物多样性及进化机制,挖掘功能基因,加速分 如果加上DNA序列中的insertions和deletions ,不同 子育种;而对大样本量的微生态系统进行全方位的 个体间基因组的差异将达到0 .5 % 。随后的研究表 研究,建立基础的微生态系统以及性状数据库,则 明,这种差异可以达到1%~3%[3] 。 可以加速微生物在人类健康、循环经济、环境生态 正是由于基因组的多样性,不同个体携带的 方面的应用。广度、深度和时间,构成了基因组数 DNA信息差异可能成为探索生命奥秘的关键密码。 据分析的三个维度,也为人类认知生命确立了一个 基因组研究在人类医药学领域和农业生产领域的潜 立体的视角。 在应用价值,驱使着世界上众多科研机构和商业公 20 11年11月,华大基因正式启动了3M计划,该 司在基因测序技术上展开激烈的角逐。如今,用 计划包括3个百万基因组计划,分别是:百万人基 5000美元即可在一周内完成人类全基因组的测序, 因组计划、百万动植物基因组计划、百万微生物基 并产生上百GB 的D N A和R N A测序数据[4] 。这意味 因组计划。3M基因组计划将从广度、深度和时间三 着,个体基因组研究的时代即将到来。我们正在走 个维度获取并分析数据,为破译具有重要经济和科 29 专题 第 8 卷  第 6 期  2012 年 6 月 GenBank数据统计 蛋白质组学比基因组学复杂得多,不同于作为稳定 s 160 160 s 实体的基因组,蛋白质组是通过与基因组的相互作 n n o o

您可能关注的文档

文档评论(0)

maxmin + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档