《大数据技术》教学大纲(本科).docxVIP

  • 10
  • 0
  • 约2.82千字
  • 约 2页
  • 2022-04-03 发布于河南
  • 举报
PAGE PAGE 121 大数据技术 一、课程简介 生物大数据所蕴含的巨大潜在价值使其备受关注。本课程起于大数据,讲授生物大数据的产生、数据资源、数据分析、可视化与实际的应用。本课程是应测序技术的普及而创建,讲授的内容面向新一代测序技术所获得的生物医学大数据。本课程主要是以大数据为主角,以解决医学相关问题为主线,旨在让学生了解生物医学大数据的基本概念,了解生物大数据的特点、价值与应用,掌握生物大数据的分析技能。 《大数据技术》这门课程的开展,从基础的大数据基本概念、大数据的发展历史、大数据的数据类型、大数据处理架构、生物大数据集成仓库、生物大数据数据处理与可视化、大数据在复杂疾病中的分析策略等各个方面入手,由浅入深,能够引导同学在面对生物医学领域中大量高通量数据时,可以独立运用所学知识进行基于大数据的实际应用,极大增强了学生的处理和分析大数据的能力,提高科研水平。 二、理论教学内容 生物大数据简介 掌握内容:生物大数据的基本概念及大数据的特点。 了解内容:生物大数据的产生背景,生物大数据的种类及其及其在生物医学方面的应用前景。 基于R与Hadoop的大数据分析理念 掌握内容:Hadoop核心组件:分布式文件系统HDFS、分布式计算框架Mapreduce和数据仓库Hive。 了解内容:Hadoop相关的其他核心组件,R与Hadoop的整合分析系统Rhadoop。 生物大数据集成仓库 掌握内容:TCGA、cBioPortal for Cancer Genomics、国际癌症基因组联盟(ICGC)和Catalogue of Somatic Mutations in Cancer(COSMIC)大数据仓库的数据组成和访问;掌握基因组变异数据库 dbGap、dbVar、1000 genomes、dbSNP、LSDBs、HGMD、OMIM和ClinVar数据存储和访问; ENCODE、NIH Roadmap Epigenomics Project、Human Epigenome Atlas、GEO、UCSC数据库数据组成和数据访问;STRING、CircNET、ImmuNet和人类信号网络等网络资源。 了解内容:4Dgenome、3CDB、MethylomeDB、DiseaseMeth、NGSmethDB和MethBas等其他的数据库资源,其他的网络通路数据资源(http:// /)。 生物大数据处理方法与软件 掌握内容:RNA-seq数据分析的基本流程、差异表达的识别软件以及应用RNA-seq数据识别 lncRNA;GSITIC处理SNP6.0芯片数据识别CNV;组蛋白修饰信号的定量、峰识别软件(如MACS、 peakSeq)以及差异的组蛋白修饰位点识别软件(如ChIPDiff);DNA甲基化定量、差异甲基化位点DMR的识别软件(如HumanMethylation450 BeadChip芯片数据开发的R包ChAMP、RMAPBS和针对WGBS甲基化数据开发的分析工具Bsmooth等)。 了解内容:WGCNA识别共表达模块以及时间序列表达的分析软件Dynamic Regulatory Events Miner (DREM);ChromHMM染色质状态识别以及区间的功能富集软件GREAT;使用 Bedtools和Samtools对测序数据进行处理;CRISPR–Cas9技术原理以及相关基因提取(如MAGeCK软件)。 生物大数据可视化 掌握内容:Epigenome Browser(即UCSC Genome Browser)、WashU Epigenome Browser、 Ensembl和JBrowse表观数据可视化浏览器;环形基因组可视化circos;cytoscape及相关的插件使用,如:功能富集的可视化插件Enrichment Map、ClueGO等。 了解内容:IGV和ChAsE (Chromatin Analysis and Exploration)等可视化软件。 6.生物大数据与复杂疾病 掌握内容:大数据与生存分析、大数据用于癌症亚型分类、大数据技术识别biomarker。 三、实验教学内容 基于SNP6.0芯片数据初步筛选乳腺癌相关的风险基因基本内容:TCGA数据库和GSITIC软件包。 基本要求:熟练运用TCGA数据库下载乳腺癌相关的SNP6.0芯片数据,并采用GSITIC软件包进行数据处理分析,初步筛选乳腺癌相关的风险基因。 识别乳腺癌条件下DMR(或DHMS)影响的生物学功能 基本内容:基于高通量测序数据识别差异甲基化区域和差异组蛋白修饰区域。 基本要求:熟练运用ChIP-seq数据,并采用软件包进行数据处理分析,初步筛选乳腺癌相关的风险基因,探索癌症表观调控影响的生物学功能。 基于乳腺癌多组学数据探索lncR

文档评论(0)

1亿VIP精品文档

相关文档