核酸序列分析.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
核酸序列分析

在线提交序列过程 1.登陆BankIt页面 /BankIt 2.填写表单内容 3.确认表单内容 4.等待电子邮件返回信息 RNA analysis http://rna.tbi.univie.ac.at/ * * * * * * * * * * * * 酵母基因组数据库---基因定位 步骤: 获取目的序列; 预测可能的编码区和非编码区; 通过相关的数据以提高基因识别的准确性(数据库搜索); 利用生物信息学资源分析序列的功能。 第五节 基因识别 策略: 先寻找并去掉重复的和复杂性较性较低的序列,再寻找基因及相关调控区域。 exon intro exon exon 5’ 3’ 增强子 非翻译区 非翻译区 GC (-100) CAAT (-70) ATG TATA (-30) TAA /TAG /TGA 帽位点 (+1) 终止位点 polyA 真核基因结构模式图 基因组外显子识别  从基因组DNA序别中识别出完整的蛋白质编码序列,即外显子部分。  外显子与内含子之间无绝对区分;同一基因不同发育时空,外显子组成不相同;假基因的存在降低预测的准确率。 EST策略的基因鉴定  电子克隆最主要的途径是从EST直接寻找新基因。确定目的EST,构建包含EST的重叠群,再进行ORF的判定及蛋白结构域等功能域的识别。 一、生物信息学识别基因的两种途径 编码区是由核糖体翻译成蛋白质的DNA序列 原核基因:编码区是一段不包含终止子的连续序列。 真核基因:编码区是由内含子隔开的若干个可读框架。 二、编码区的分析 终止密码子(TGA、TAA或TAG)数量较少; ORF达到一定的长度; 密码子使用的偏好性,第3个碱基G/C出现的频率较高; 与已知基因比较有序列相似性; 与模板序列的模式相匹配可能指示功能性位点的位置。 编码区的统计特征: 转录起始点、核糖体结合位点、起始密码子、RNA剪接位点、终止密码子、poly(A)位点等。 编码区的一些信号: 分析与基因表达调控相关的信息、各种功能位点及基因转录调控元件。 DNA序列上特殊的片段,是蛋白质因子作用的位点,是与基因转录、翻译有关的信号序列。 通过模式识别及生物信息软件分析。 三、非编码区的分析 启动子 启动子 转录区 终止子 外显子 内含子 基因的一般结构 TATA box 起始序列 (TATAT/AAT/A) (C/TC/TCAA/GA/G) 转录因子结合区 CCAAT GC 真核生物启动子 -30bp,TATA box -80bp,CAAT box -80bp?110bp,GCCACACCC或GGGCCGGG TATA盒使转录精确地起始 CAAT盒和GC盒控制转录的起始频率 http://www.epd.isb-sib.ch /molbio/proscan/ /molbio/signal/ 信号肽 Authors Sequin BankIt Sequence data GenBank Accession number 7 days Draft record 第六节 核酸序列的提交 BankIt BankIt是NCBI提供的一个在线提交序列的工具。由一系列表单,包括联络信息、发布要求、引用参考信息、序列来源信息、以及序列本身的信息等。 用户提交序列后,会从电子邮件收到自动生成的数据条目,Genbank的新序列编号,以及完成注释后的完整的数据记录。 用户还可以在BankIt页面下修改已经发布序列的信息。 BankIt适合于独立测序工作者提交少量序列,而不适合大量序列的提交,也不适合提交很长的序列,EST序列和GSS序列也不用BankIt提交。 sequin 1. 大量的序列提交可以由Sequin程序完成。 2. 能方便的编辑和处理复杂注释。 3. 提交来自系统进化、种群和突变研究的 序列,可以加入比对的数据。 4. 用于序列的分析,FASTA或ASN.1格式。 /guide/ 获得待分析序列对应的UniGene编号,而大部分UniGene序列已经具有明确的定位信息,可以得到待分析序列的基因定位。 2. 利用UniGene数据库进行定位 /unigene 将待分析序列输入基因组数据库进行同源性检索; 得到确定的基因组序列后点击“Genome view”观察基因组结构; 点击红色标记所指示的染色体列表中选择对应的染色体及区域; 浏览器中将显示详细的基因定位结果。 3.利用基因组序列进行定位 BLAST搜索数据库进行基因定位 通过基因组数据库定位---NCBI基因组数据库 基因定位 拟南芥基因组数据库---基因定位 cDNA文库 EST 较长cDN

文档评论(0)

tmd2017 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档