- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
生物信息学;第十三章 新一代测序技术与
复杂疾病;学习提纲; 难点
;第一节 引言
(Introduction);、第一代测序技术;二、新一代测序技术迅速发展;第二节
新一代测序技术概述;一、新一代测序技术基本概念;(二)测序分辨率、覆盖度与测序深度;二、新一代测序技术常见测序仪及工作流程;有这些新型测序仪都使用了一种新的测序策略:
循环芯片测序法(cyclic-array sequencing),也可将其称为“新一代测序技术或者第二代测序技术”。;工作流程(Roche);emPCR 和桥式PCR示意图;三、新一代测序数据存储、处理与分析;(一)新一代测序数据格式与质量编码;(二)测序短片段在参考基因组中的定位;(三)新一代测序数据库;Sequence read Archive (SRA);;根据SRA数据产生的特点,将SRA数据分为四类:
study—研究课题
experiment—实验设计
run—测序结果集
sample—样品信息;;??击 Run、Sample、Experiment、Study 可以进行相关内容的检索
;;层次关系;The Run Browser;;Filtering and Selection;Name of a spot plus a
window in pixels around it.?
EXWA4RL02G9Z6H X=100 Y=100?- will return
all spots located within 200 pixels (in X and Y) from a given spot.
;Downloading Data from the Run Browser;Using SRA Data;四、新一代测序短片段比对; 第三节 DNA测序技术及应用;外显子组是指全部外显子区域的集合,该区域包含合成蛋白质所需要的重要信息,涵盖了与个体表型相关的大部分功能性变异。
外显子组序列捕获及第二代测序是一种新型的基因组分析技术。
与全基因组重测序相比,外显子组测序只需针对外显子区域的DNA即可,覆盖度更深、数据准确性更高,更加简便、经济、高效。
可用于寻找复杂疾病如癌症、糖尿病、肥胖症的致病基因和易感基因等的研究。;二、DNA测序数据分析方法;A?good Illumina dataset?VS A?poor Illumina dataset;(二)片段比对:Bowtie;生殖细胞突变召回
体细胞突变召回
拷贝数变异(copy number variation,CNV)识别
SV识别;(四)数据可视化:IGV
;三、DNA测序应用;?De novo测序即不借助任何参考序列信息对某物种进行测序,然后用生物信息学的分析方法对测出的序列进行拼接、组装,从而获得该物种的基因组序列图谱。
可应用于细菌、真菌、动物和植物等的基因组测序
宏基因组测序
;metagenomic;如何利用重测序进行SNP分析?;(3) 根据一定规则来筛选可靠的SNP位点,这些规则会因为不同需求有所不同,如MAQ中规定:
①SNP位点附近3bp内没有另外的SNP;
②SNPs的覆盖度要大于3;
③SNP必须有质量分数60的序列覆盖;
④在任意连续的10bp中不超过3个SNP;
……
(?4) 为了更直观地查看SNP位点信息,可以使用一些可视化的软件进行画图。;SNP 可视化;基因拷贝数变异:copy number variations ;High Throughput DNA Sequencing based Methods to detect CNVs;Rare variants;四、DNA测序技术应用于复杂疾病案例; 第四节
RNA测序技术与数据分析;、RNA测序技术流程;二、RNA-seq 数据分析;由于测序错误引起的碱基插入、缺失、错配等现象使得reads比对更为复杂,影响比对结果的准确性。
在序列比对过程中,一个read可能比对到基因组的多个位置。 ;常用比对软件;(二)转录组的重建;常用装配软件;(三)转录本的表达定量;(四)RNA-seq的差异表达分析;差异表达分析的软件;三、RNA-seq的应用;同一基因产生的不同结构的mRNA和蛋白质也被称作可变剪接异构体。
可变剪接的方式主要包括5种类型:外显子盒、外显子互斥、可变5’供体、可变3’受体和内含子保留。
可变剪接广泛存在于人类细胞中,极大地丰富了mRNA和蛋白质的种类和功能。 ;2.RNA-seq识别可变剪接;目前常用的基于RNA-seq的识别可变剪接软件,TopHat的工作流程:;步骤
1.reads基因组比对
2.预测潜在外显子
3.预测可能的剪切方式
4.匹配识别剪接位点
文档评论(0)