- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
4.3.5 3’UTR区 双序列比对参数设置 Aln文件可用Bioedit软件打开 dnd文件可用tree view软件打开 4.3 基因结构识别 4.3.1 ORF识别及其可靠性验证 ORF( open reading frame )是一个潜在的蛋白质编码区,确定DNA序列的编码区,就需要检测该序列中有多少个ORF, 并验证所预测ORF的可靠性 (一)ORF( open reading frame ) (二)验证依据 1、在ORF上发现不寻常的序列变异类型,即每个第3碱基趋向于相同的概率远大于仅仅由随机产生的概率。 GCG软件包的TESTCODE程序可以提供序列中每个第3碱基的非随机性标示。 2、通过分析确定ORF的密码子是否与那些用于同一生物其他基因中的密码子一致 可以用GCG软件包的CODONFREQUENCY程序进行分析 3、比对法,将所预测的ORF翻译成氨基酸序列,然后将结果序列与现有数据库进行BLASTP比对,如果发现1个或多个相似的序列,则所预测ORF的可信度就比较高。 (三)原核与真核生物ORF区别 原核生物编码区只含有一个单独的ORF 真核生物编码区被内含子分隔成若干个不连续的外显子,因此分析真核基因的编码区时,需要正确识别内含子和外显子的边界。 (四)Kozak规则(基于已知数据的统计结果) 即第一个ATG侧翼序列的碱基分布所满足的统计规律,若将第一个ATG中的碱基A\T\G分别标为1、2、3位,则Kozak规则描述如下: (1)第4位的偏好碱基为G (2)ATG的5’端约15bp范围内的侧翼序列 内不含碱基T。 (3)第3、6、9位,G为偏好碱基 (4)除第3、6、9位,C为偏好碱基 (五)ORF分析工具(如ORF finder) 实例分析(page 94) 应用ORF Finder预测水稻瘤矮病毒(RGDV)S8片段的ORF. 研究背景:为构建融合蛋白的表达载体,需要对RGDV S8片段的基因序列进行ORF分析并确定其位置,为设计表达引物提供信息。 1、提交序列 2、参数设置 3、预测结果 4 可靠性验证 5、结果解读 4.3.2 启动子及转录因子结合位点分析 1、启动子: 启动子是RNA聚合酶识别、结合并开始转录所必需的一段DNA序列。 原核生物:转录起始位点+1 -10序列(解旋区) -35序列(识别区) CAP序列-70~-40(增强聚合酶结 合和转录的起始序列) consensus sequences 真核生物 (1) 核心启动子:起始位点,TATAbox (2)上游启动子元件UPE:CAAT框,GC框 实例分析 以真核基因GRP78为例,预测启动子及转录因子结合位点 以promoter scan识别启动子区并预测与该区可能结合的转录因子 4.3.3 重复序列分析 哺乳动物基因组存在大量重复序列: 高度重复序列:10-300bp,重复106次左右,占10%-60%,人占20%,功能不清楚 中度重复序列:100-500bp,重复10-105次,占10%-40%,功能不清楚 单拷贝序列: 占50%-80%,蛋白质编码基因 实例分析 使用RepeatMasker在线服务器屏蔽重复序列 4.3.4 CpG island CpG island是DNA上的一个区域,富含GC 两者以磷酯键相连 定义为一个至少含有200bp的区域,其中 CpG的观察值/预测值比例大于0.6且GC含量大于50%,长度约几百到几千不等。 CpGisland经常出现在管家基因或频繁表达的基因的启动子附近,在这些部位, CpGisland具有阻止序列甲基化的作用。 因此,搜索CpGisland可以为基因及其启动子的预测提供重要的线索。 两种版本的Blast比较 单机版 单机版的blast可以通过NCBI的ftp站点 得,有适合不同平台的版本(包括linux,dos 等。获得程序的同时必须获取相应的数据 库才能在本地进行blast分析。单机版的优点 是可以处理大批的数据,可以自己定义数据 库,但是需要耗费本地机的大量资源,此外 操作也没有网络版直观、方便,需要一定的 计算机操作水平。 网络版本 包括NCBI在内的很多网站都提供了在线的blast服务,这也是我们最经常用到的blast服务。网络版本的blast服务就有方便,容易操作,数据库同步更新等优点。但是缺点是不利于操作大批量的数据。 BLAST BLAST 是一个序列相似性搜索的程序包,其中包含了很多
文档评论(0)