- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
核 酸 和 蛋 白 质 序 列 分 析
, ,
关键词: 核酸序列 ? ? 蛋白质序列 ? ? 分析软件 ? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ??
在获得一个基因序列后,需要对其进行生物信息学分析,从中尽量发掘信息,从而指导进一步的实
验研究。通过染色体定位分析、内含子/外显子分析、 ORF分析、表达谱分析等,能够阐明基因的
基本信息。通过启动子预测、 CpG岛分析和转录因子分析等,识别调控区的顺式作用元件,可以为
基因的调控研究提供基础。通过蛋白质基本性质分析,疏水性分析,跨膜区预测,信号肽预测,亚
细胞定位预测,抗原性位点预测,可以对基因编码蛋白的性质作出初步判断和预测。尤其通过疏水
性分析和跨膜区预测可以预测基因是否为膜蛋白, 这对确定实验研究方向有重要的参考意义。 此外,
通过相似性搜索、功能位点分析、结构分析、查询基因表达谱聚簇数据库、基因敲除数据库、基因
组上下游邻居等,尽量挖掘网络数据库中的信息,可以对基因功能作出推论。上述技术路线可为其
它类似分子的生物信息学分析提供借鉴。本路线图及推荐网址已建立超级链接,放在北京大学人类
疾病基因研究中心网站( ), 可以直接点击进入检索网站。
? ?下面介绍其中一些基本分析。值得注意的是,在对序列进行分析时,首先应当明确序列的性质 ,
是 mRNA序列还是基因组序列?是计算机拼接得到还是经过 PCR扩增测序得到?是原核生物还是真
核生物?这些决定了分析方法的选择和分析结果的解释。
(一)核酸序列分析
1、双序列比对( pairwise alignment )
? ? 双序列比对是指比较两条序列的相似性和寻找相似碱基及氨基酸的对应位置,它是用计算机进
行序列分析的强大工具,分为全局比对和局部比对两类,各以 Needleman-Wunsch 算法和
Smith-Waterman 算法为代表。由于这些算法都是启发式( heuristic )的算法,因此并没有最优值。
根据比对的需要,选用适当的比对工具,在比对时适当调整空格罚分( gap penalty )和空格延伸
罚分( gap extension penalty ),以获得更优的比对。
? ? 除了利用 BLAST、FASTA等局部比对工具进行序列对数据库的搜索外,我们还推荐使用 EMBOSS
软件包中的 Needle 软件(),和 Pairwise BLAST
()。以上介绍的这些双序列比对工具的使用都比较简单,一般输入所比较的序列即可。
(1)BLAST和 FASTA
? ? FASTA()和 BLAST ()是目前运用较为广泛的相似性搜索工具。这两个工具都采用局部比对的
方法,选择计分矩阵对序列计分,通过分值的大小和统计学显着性分析确定有意义的局部比对。使
用 FASTA和 BLAST,进行数据库搜索, 找到与查询序列有一定相似性的序列。 一般认为 , 如果蛋白的
序列一致性为 25-30%, 则可认为序列同源。 BLAST根据搜索序列和数据库的不同类型分为 5 种(表2 ),
另外 PSI-BLAST 通过迭代搜索,可以搜索到与查询序列相似性较低的序列。其中 BLASTN、BLASTP
在实践中最为常用, TBLASTN在搜索相似序列进行新基因预测时特别有用。
? ? 使用 BLAST时,先选择需要使用的 BLAST程序,然后提供相应的查询序列,选择所比对的数据
库即可。
(2)Needle 和 Pairwise BLAST :其中 Needle 适用于蛋白质和 DNA序列,而 Pairwise BLAST 仅适用
于 DNA序列
(3)相似性和同源性:必须指出,相似性( similarity )和同源性 ( homology) 是两个完全不同的
概念。同源序列是指从某一共同祖先经过趋异进化而形成的不同
原创力文档


文档评论(0)