- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
服务数据驱动的基因组分析与解读服务数据驱动的基因组分析与解读
服务:数据驱动的基因组分析与解读
陈钢
CTO@WeGene
个人基因组为用户做什么?
目录
我们在阿里云生态中的实践
content
未来的基因组数据平台
一、个人基因组为用户做什么?
WeGene :基因组数据
Fitbit :运动数据
若饭:定量饮食
Quantified Self !
二、我们在阿里云中的实践
数据存储
RDS :预处理后的基因组数据,表型数据,网站数据
OSS :基因组原始数据,大型的计算结果:
全基因组数据:FASTQ ,BAM ,约每用户200GB ,约50用户
芯片数据:CEL ,约每用户200MB ,约7000用户
GeneDock :正在处理的全基因组数据和芯片数据
本地存储:所有数据的备份
数据传输
• 芯片数据:实验室用OSS客户端上传OSS
• 全基因组数据:通过GeneDock的专线上传GeneDock系统
• 23andme等数据:通过API直接存储RDS
计算
• 本地服务器:
• 主要用于研发,或者是处于alpha测试阶段的产品,Celery调度
• 基于Spark的芯片数据质控
• ECS :
• 实时的小规模计算,例如简单的遗传风险评估;
• 常规Web服务
• GeneDock :
• 全基因组数据分析
三、未来
基因组数据的二次分析
统计分析,机器学习,数据可视化
全基因组数据存储、分析和可视化
Genomics API ,上层应用,标准化
亚洲人群的Genome Graph
参考数据集,自学习系统,开放服务
您可能关注的文档
最近下载
- 汉威 HS 7X系列数字式超声波探伤仪使用说明书.pdf VIP
- 中华民族共同体概论课件第二讲树立正确的中华民族历史观PPT.ppt VIP
- “电—能—碳”模型构建与碳排放预测:以江苏为例进行实证分析.docx VIP
- 《合同风险防控要点》课件.ppt VIP
- 【山东省】DB37T 3366-2018 涉路工程技术规范(高清).pdf VIP
- 北师大版八年级数学上册第三章位置与坐标测试题.pdf VIP
- 18DX009 数据中心工程设计与安装.docx VIP
- 10KV配电系统的电流互感器2CT、3CT的比较.pdf VIP
- GB50790-2013(2019年版):±800kV直流架空输电线路设计规范(2019年版).pdf VIP
- 《概率论与数理统计》第8章 回归分析.ppt VIP
文档评论(0)