- 1、本文档共26页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
生物信息学原理与方法第八讲dna序列流分析与预测
生物信息学 原理与方法第一讲 DNA序列分析与预测 基因结构(内含子和外显子交界区符合gt-ag 规则) 目录 一、定义 二、软件资源 三、基本步骤 四、电子克隆cDNA全长序列 五、重复序列分析 数据库同源搜索 六、基因电子定位与预测 七、基因结构预测 八、ORF预测 九、内含子 / 外显子剪接位点 十、tRNA 基因识别 一、DNA序列分析与预测的定义 就是在核酸序列中寻找基因,找出基因的位置和功能位点的位置等过程。 在此过程中,确认一段DNA序列是一个基因需要有多个证据的支持。 一般而言,确定基因的位置和结构需要多个方法综合运用,而且需要遵循一定的规则: 对于真核生物序列,在进行预测之前先要进行重复序列分析,把重复序列标记出来并除去;选用预测程序时要注意程序的物种特异性;要弄清程序适用的是基因组序列还是cDNA序列。 核酸序列数据库 ?Genbank,美国国家生物技术信息中心的数据库( )。 ?EMBL,建立在欧洲分子生物实验室的数据库 (http://www.embl.de/)。 DDBJ,是DNA Data Bank of Japan的简称,又叫日本的DNA数据库银行(available at http://www.nig.ac.jp )。 四、电子克隆cDNA全长序列 电子克隆技术以数学为核心,以计算机和互联网为工具,利用现有的表达序列标签(EST)和生物信息数据库, 可以加速对人类基因组未知功能新基因的发掘,为人类功能基因组学与蛋白质组学研究提供新的线索和基础。 基本原理 获得未知基因的c DNA部分序列后 ,采用生物信息学的方法延伸EST序列 ,以获得基因的部分乃至全长 c DNA序列 。 电子克隆的技巧 1.如何鉴定片段重叠和筛选最佳目的EST 2.选择合适的片段用于检索EST数据库 五、重复序列分析 对于真核生物的核酸序列而言,在进行基因辨识之前都应该把简单的大量的重复序列标记出来并除去,因为很多情况下重复序列会对预测程序产生很大的扰乱,尤其是涉及数据库搜索的程序。常见的重复序列分析程序有CENSOR(/)和RepeatMasker(/)等,可以在Web界面上使用这些程序,或者用Email来进行。 如果有大量序列需要处理,可以使用XBLAST程序,它可以从Internet上下载得到。XBLAST中以及包含了由程序作者收集整理的一些重复序列,此外还可以从Repbase中找到更多的重复序列。还可以把克隆载体也加入重复序列中,这样就可以在处理重复序列时顺便把克隆载体也一同除去。经处理的序列中重复序列所在位置会一律由“X”代替。 基因识别的方法 利用同源比对(blast)。 基于基因中编码序列和非编码序列区域碱基的统计差异性。 根据真核基因的生物结构,建立整体的基因预测模型.(Genscan)。 九、内含子 / 外显子剪接位点 剪接位点一般具有较明显的序列特征,但是要注意可变剪接的问题。由于可变剪接在数据库里的注释非常不完整,因此很难评估剪接位点识别程序预测剪接位点的敏感性和精度。如果把剪接位点和两侧的编码特性结合起来分析则有助于提供剪接位点的识别效果。 常见的基因识别工具很多都包含了剪接位点识别功能,独立的剪接位点识别工具有 NetGene 。 NetGene 服务的 Email 地址是: netgene@cbs.dtu.dk 。 http://www.cbs.dtu.dk/services/NetGene2/ 十、tRNA 基因识别 tRNA基因识别比编码蛋白质的基因识别简单,目前基本已经解决了用理论方法预测tRNA基因的问题。tRNAscan-SE工具中综合了多个识别和分析程序,通过分析启动子元件的保守序列模式、tRNA二级结构的分析、转录控制元件分析和除去绝大多数假阳性的筛选过程,据称能识别99%的真tRNA基因。可以在Web上使用这个工具,也可以下载这个程序。 tRNAscan-SE的网址是: /eddy/tRNAscan-SE/ 。 * * Biology Protein Phenotype DNA (Genotype) 二、软件资源 在上找有关生物信息学的网站或网页 第一步:获取DNA 目标序列 ① 如果你已有目标序列,可直接进入第2 步; ② 可通过PubMed查找你感兴趣的资料;通过GenBank 或EMBL 等数据库查找目标序列。 第二步:查找ORF 并将目标序列翻译成蛋白质序列 利用相应工具,如ORF Finder 、Gene feature(Baylor College of Medicine)、GenLang(University of Pennsylvania)等,查找ORF并将DNA序列翻译成蛋白质序列。 三、DNA序列
您可能关注的文档
最近下载
- 中文分级阅读测评系统.pdf VIP
- 油气勘探风险评价与决策技术:方法、应用与创新.docx VIP
- 六朝古都齐聚首 烟花三月下扬州.doc VIP
- 深圳市建设工程消防设计疑难解析.doc VIP
- 铜绿假单胞的治疗药物选择.ppt VIP
- ASCO300系列开路切换自动转换开关ATS.doc VIP
- ASCO300系列.pdf VIP
- 项目一集控运行职业岗位认知课件.pptx VIP
- Nordic 系列:nRF52840 (基于 Cortex-M4)_(25).nRF52840的硬件测试.docx VIP
- Nordic 系列:nRF52840 (基于 Cortex-M4)_(16).nRF52840的硬件设计指南.docx VIP
文档评论(0)