- 1、本文档共3页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
信号肽预测工具SignalP中文说明
信号肽预测工具SignalP 中文说明
SignalP 大名鼎鼎的信号肽预测服务器,它的功能是预测给定的氨基酸序列中是否存在潜在的信号肽剪切
位点及其所在,原核生物和真核生物都可以进行预测。目前服务器提供的是SignalP 3.0 版本。
这个是我们输入序列的界面,我们来简单的说一下使用(基本是翻译的O(∩_ ∩)O 哈哈~不用去看英文的
了):
提交序列中的选项
A .序列输入方式:
有两种方式:一种是直接输入FASTA 格式的氨基酸序列,可以是一条也可以是多条;另一种是本地上传包含
含有FASTA 格式序列的文件。
这里要注意我们必须输入氨基酸序列,看过有的朋友用核酸序列去预测的;输入的氨基酸序列为单字母简写
形式。除了20 中氨基酸外,仅允许使用X 代表未知氨基酸。所有序列中的其他字母(非20 种氨基酸简写和
X 的)被视为X ;所有的非字母字符将会自动忽略。
还要注意的是对序列长度和多少的限制:每次最多提交2000 条序列进行分析;总氨基酸残基不能超过20 万;
每条序列不能超过6000 残基。其实一般来讲我们都不会有这么多序列一起去预测的O(∩_ ∩)O 哈哈~
B .物种选择:
根据你预测的蛋白质来源选择革兰氏阳性细菌、革兰氏阴性细菌或真核生物。
C .方法选择:
可选神经网络法(neural network ,结果中简写NN );隐马可夫模型(hidden markov models ,结果中简写HMM )
以及联合两种方式。默认为两种一起预测。
本文档由腾飞生物论坛发布,为配合腾飞生物网址导航系统()而制作,谢谢您的关注。
两种方法各自的优势:HMM 主要在于预测是否含有信号肽;NN 主要为预测信号肽位点。
D .是否输出图表:
图表方式显示的界面要直观一些,默认为GIF 格式,不用改了。
E .输出格式:
默认为标准模式,输出的结果中含有预测的图表,序列的总体分析数据如是否含有信号肽及其位点;Full 模
式除 Standard 中含有的数据外还有每个氨基酸对应的相应分析数据;Short 的结果仅有序列的总体分析数据。
同样建议默认不要改变。因为full 模式中数据对我们来说意义不大。
F .分析长度:
一般来讲,信号肽在蛋白质N 端,极少超过45 个氨基酸残基。所以在序列中仅N 端部分序列对信号肽的分
析预测具有重要作用。默认为分析N 端70 个氨基酸,后面的不做分析。如果你想要全部的分析将此值设置为
0 即可。
G .隐私声明:
分析结束后会删除你提交分析的数据。
结果显示
神经网络法NN 中结果主要主要涉及3 个值:C、S 和Y 。
S 值:每个氨基酸对应1 个S 值,在结果显示的图表中有一个曲线显示S 值的变化趋势,(在full 模式中可以
看见具体数值),信号肽区域的S 值较高。
C 值:剪切位点值。每个氨基酸会有一个C 值,在剪切位点处C 值是最高的。
Y 值:Y-max 综合考虑S 值和C 值的一个参数,其比单独考虑C 值要更精确。因为在一条系列中C 值可能有
不止一个较高的位点,但是剪切位点只有一个;此时的剪切位点就由Y-max 值来推测的,为S 值是陡峭的位
置和具有高C 值的位点。
在现在的3.0 版本中还有两个值S-mean 和D 值。
S-mean 是从N 端氨基酸开始到剪切位点处各氨基酸的平均S 值。
D 值是S-mean 和Y-max 的平均值,对区分是否为分泌蛋白具有重要作用。
隐马可夫模型(HMM )主要计算序列中是否含有信号肽,在真核生物的预测中还有signal anchor 的一个参数
(相当于信号肽),并进一步分为n-region 、h-region 和c-region 三个部分。
这里我就直接用服务器中提供的结果说明为例。
在分泌蛋白的预测结果中,NN 法Signal peptide 列中结果为yes ,并根据C 值、S 值和Y 值等给出潜在的剪切
位点;图表右上角处有C 值、S 值和Y 值的曲线颜色指示,图表中有各值的变化趋势曲线。
HMM 法文本结果显示其含有信号肽的可能性以及潜在的剪切位点;图表中给出信号肽不同区域划分的预测。
本文档由腾飞生物论坛发布,为配合腾飞生物网址导航系统()而制作,谢谢您的关注。
文档评论(0)