基因组医学的大数据分析-tatubu.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基因组医学的大数据分析-tatubu

综述 基因组医学的大数据分析 1 2 2,3, Karen Y. He , 葛东亮 ,*和Max M. He * 1. Department of Epidemiology and Biostatistics, CaseWestern Reserve University, Cleveland, OH 44106, USA; kyh9@ 2. 中国南京百家汇科技创业社区有限公司,邮编210042 3. Computation and Informatics in Biology and Medicine, University of Wisconsin-Madison, Madison, WI 53706, USA * 通讯方式:dgeduke@ (D.G.);maxm.he@ (M.M.H.);电话: +86-25-8556-6666 (分机号3308 )(D.G.);传真:+86-25-8532-2781 (D.G.) 学术编辑:William Chi-shing Cho 接收日期:2016 年 10 月24 日;接受日期:2017 年2 月9 日;发表日期:2017 年2 月 15 日 摘要:基因医学试图通过利用患者的基因组信息,建立个性化的诊断或治疗策略。大数据分 析通过大量查阅各种数据集来发现隐藏模式、未知相关性和其他见解。虽然在大数据基础设 施上整合和处理各种基因组数据和综合电子健康记录(EHR)具有挑战,但这也为开发一 种有效方法来识别临床可干预的遗传变异,从而用于个性化诊疗提供了一个可实现的机遇。 在本文中,我们回顾了处理大规模二代测序(NGS)数据和基因医学电子健康记录(EHR) 中的不同临床数据所面临的挑战。针对实施基因医学时处理、管理和分析基因组和临床数据 所带来的各种挑战,本文介绍了可能的解决方案。此外,本文还展示了一个实用的大数据工 具集,用于利用高通量二代测序和EHR 的数据来识别临床上可干预的遗传变异。 关键词:大数据分析;临床上可干预的遗传变异;电子健康记录;医疗;二代测序 ______________________________________________________________________ 1. 引言 新一代测序(NGS)技术,如全基因组测序(WGS )、全外显子测序(WES )和/或 靶向测序,更加频繁应用于生物医学研究和医学实践,以鉴别疾病相关和/或药物相关的遗 传突变,从而推进精准医学发展[1,2] 。根据患者的遗传构成、生活方式和环境因素,精准医 学使科学家和临床医生能够更准确地预测对亚组患者发挥功效的具体治疗和预防方法[3] 。 到目前为止,已经在基因水平上对6000多种孟德尔遗传病进行了研究[4,5] ,并且已经用全 基因组关联研究(GWAS)方法对超过1500种临床相关的复杂性状进行了研究[6] 。随着电 子病历的广泛应用,已可以利用电子健康病例 (EHR)进行临床研究[7] 。此外,已经设计 了许多基因组和EHR数据的研究组合,以改善临床研究和/或医疗预后 (表1)。 Int. J. Mol. Sci. 2017, 18, 412; doi: 10.3390/ijm/journal/ijms Int. J. Mol. Sci. 2017, 18, 412 2 / 18 利用源自EHR的综合临床资料扩充大规模基因组数据,将影响个性化诊断和治疗中疾 病和药物相关的突变。临床基因组测序中的NGS技术进步和EHR的应用很有可能在临床实 践中创建以患者为中心的精准医学。NGS技术生成的基因组数据是支持基因组医学的重要 组成部分,但数据量和数据复杂性对其在临床实践中的应用提出了挑战[8] 。例如,对单个 全基因组进行测序可生成超过100 GB的数据。因此,在临床实践中需要开发新的生物信息 学基础架构来实施NGS。 大数据是一个术语,用于描述常规数据处理方法不足以处理的大量或复杂数据集合。不 同人对大数据有不同的描述[9] 。大数据最流行的定义是5V——容量(Volume )、速度 (Velocity )、种类(Variety )、验证/真实性(Verification/Veracity )和价值(Value )[10] 。 未来,大数据的定义可能随着技术的发展而发生改变。大数据基础架构是一个框架,涵盖了 包括Hadoop

文档评论(0)

zhuwo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档