- 70
- 0
- 约7.89千字
- 约 62页
- 2021-04-16 发布于安徽
- 举报
癌症相关数据库
http://2016./Team:NJ U-China/ Background
癌症在中国的情况
http://2016./Team:NJ U-China/ Background
癌症相关数据库
• Nucleic Acids Research杂志中列出癌症相关的数据库列表:
• /nar/database/subcat/8/33
基因组变异数据库 (突变、SNP、插入、缺失、拷贝)
癌症相关基因数据库 (促癌、抑癌基因、转移相关基因)
癌症基因表达数据库 (利用基因芯片、测序检测等技术检测
基因在各癌症的表达情况、差异表达分析)
癌症表观遗传修饰数据库 (DNA 甲基化、表观遗传修饰)
非编码RNA (癌症相关miRNAs ,circRNAs ,lncRNAs等)
癌症调节网络关系数据库 (癌症基因间的调节关系)
癌症大规模数据储存、分析平台 (癌症相关高通量数据的查
询、访问及分析)
The Cancer Genome Atlas (TCGA)
• 起始于2005,由National Cancer Institute (NCI)和National Human
Genome Research Institute (NHGRI)共同负责,预计2006~2009年花费1.1
亿美元获取癌症基因组的遗传变异。
• 美国政府投入5亿美元,预计再接下来的5年内 (2010~2015 )获得
20~30种癌症的基因组变异。
• 目的:利用大规模基因组测序技术,挖掘癌症的基因组图谱,加快我
们对癌症分子基础的理解,提高我们对癌症的诊断、治疗和预防能力。
• 目前TCGA项目涉及33种癌症,11328个病人,样本包含癌症组织、
癌旁组织,血液等,总数据大小为2.5 petabytes 。
数据类型
• Tumor characteristics:
• DNA mutation
• Copy-number variation
• Gene expression
• DNA methylation
• MicroRNA activity
• Cellular protein activity
• Clinical data
• Whole genome sequences
• Whole exome sequences
• Sequence traces
• Mutations, including coding, splice site, germline and noncoding somatic variants
• RNA sequencing
• miRNA sequences (calculated expression per miRNA and isoform)
• mRNA sequences (calculated expression per gene, exon, splice j unction, isoform)
• Total RNA sequences (calculated expression per gene, exon, splice j unction, isoform)
• Expression signals per gene, exon, splice j unction, miRNA, and isoform
• Copy number
•
原创力文档

文档评论(0)