- 1、本文档共54页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大规模表达序列标签(EST)测定及分析 中山大学生科院 主要内容 什么是 ESTs ? Serial analysis of gene expression (SAGE) 技术流程 基因芯片或微阵列技术流程 几种大规模分析基因表达水平的方法的比较 ESTs数据的不足 EST技术流程 一、cDNA文库构建 cDNA文库的构建及其均一化扣除杂交处理 扣除杂交技术的发展 SSH的原理与基本过程 二、序列测定及数据分析 测序方向的选择 序列前处理 (pre-processing) 镶嵌克隆的识别 常用的拼接软件 Cluster的连接 UniGene TIGR Gene Index STACK Clean Short and Tight 基因注释及功能分类 后续分析 实例介绍 文库信息 序列质量处理 序列长度和质量分布 聚类和重叠群(Contig)分析 BLAST Search against human genome sequence(e=1e-5) 功能分类和注释 表达量比较实例 ◆ Unigene 结合有指导的和无指导的方法,而且在聚类过程中使用了不同水平的严格度,聚类的算法为megablast,数据库不产生一致性序列。 ◆ TIGR Gene Index用的是有严格的和有指导的聚类方法,聚类的算法为类似于BLAST和FASTA的FLAST, 该法得到的一致性序列较短,交替剪切得到的不同的基因属于不同的索引。 ◆ STACK 用不严格的和无指导的聚类方法,聚类的算法为d2_cluster,产生较长的一致性序列,同一索引中含有不同的剪切方法得到的基因。 TIGR-THC UniGene STACK Long and Loose 注释: ◆ 序列联配 Blastn, Blastx ◆ 蛋白质功能域搜索(二结构比对) Pfam Interpro 基因功能分类 ◆ 手工分类 大部分以Adams 95年的文章中的采用分类体系为标准。 【Adams. MD, et al. Initial assessment of human gene diversity and expression patterns based upon 83 million nucleotides of cDNA sequence. Nature. 1995 377(6547 Suppl):3-174 】 ◆ 计算机批量处理 利用标准基因词汇体系Gene Ontology,进行近似的分类。 (/) GO的组织结构:定向无环图( directed acyclic graphs [DAGs]) 各大数据库中基因或基因产物与GO术语的对照 其它分类系统与GO的对照表 ◆ 比较基因组学分析 ◆ 基因表达谱分析 ◆ 新基因研究 ◆ 基因可变剪切分析 ◆ 实验验证 ? MicroArray ? GeneChip ? RTPCR ? Northen bloting 家猪脑组织EST分析 Newborn 115d Foetus 50d Early born 107d Foetus 50d Foetus 100d Foetus 50d adult Develop-mental phase Brain stem Cortex cerebrum Cerebellum Tissue fbs ebs fcc ecc fce ece cbe Library name 文库与序列质量检验 聚类和重叠群分析 ORF的寻找 功能分类和注释 表达谱分析 交替剪接分析 分析过程 序列长度和质量处理 序列长度:无统一标准,一般认为100bp以上的 EST即可代表足够表达基因信息 ——污染序列去除,包括载体序列、细菌基因组序列(Crossmatch) ——重复序列的屏蔽(RepeatMasker) ——低质量区去除(Q20) ——扔掉100bp以下的序列 High-quality ESTs 46011, Avg. full length: 388.5 , Avg. quality: 35.9 per base 13459 5176 46011 Cap3 10763 5740 46011 Phrap singlets contigs 高质量序列 拼接软件 Based on phrap assembly Contig 大小分布 * 什么是EST? EST的应用 EST序列测定及分析过程 实例:家猪脑组织EST分析 ESTs的来源 上世纪80年代,对cDNA序列进行大规模测序的想法就曾提出,但对此一直存在争论,有人认为这种方法能发现成千上万的新基因;而反
文档评论(0)