- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
编号农业微生物研究中心[青枯雷尔氏菌-20101120]共8页承担单位.doc
编号:生物[青枯雷尔氏菌 共8页
承担单位:福建省农科院农业生物资源研究所
试验设计:
试验项目:青枯雷尔氏菌RS91和RS98预测基因的
GO注释及功能分类
——基于uniprotKB、GOA及GO
初步构建基因功能注释平台
试验人员:唐唯其
试验负责:
报告日期:2010-11-20
计数月份:2010年11月
研究资格系数
(0.5-1.0)
实验设计系数
(0.9-1.0)
报告得分
总分
实验设计
实验记载
实验分析
实验简报
实验文章
1-20%
21-40%
41-60%
61-80%
81-100%
1%-5%
设计,实施实验,记载,分析清晰,结论清晰文献完整,发表水平
农业微生物研究中心
电话: 0591 传真: 0591 试验目的
本实验的目的是在本地初步构建一套基因注释平台,这个平台基于和UniProt(包括swiss-prpt和trEMBL)的同源比对,通过uniprot GOA(GO gene Association)获得基因的GO(Gene Ontology)注释。
本次实验将对青枯雷尔氏菌RS91和RS98预测基因在本地进行GO注释。
实验内容
2.1 建立本地数据库,构建平台所需的数据
本次实验将基于UniProtKB(包括swiss-Prot和trEMBL)和uniprot GOA(GO gene Association)构建一个基因功能的GO(Gene Ontology)注释平台。因此需要从uniprot网站、GO网站或者EBI网站下载大量数据,考虑到本地数据库的更新,下载数据将通过一个简单的bat脚本实现,该脚本调用wget下载工具,可实现镜像方式的下载,而且能够方便地定期更新。
下载uniprotKB(/)的swiss-prot和trEMBL,前者是有报道过的蛋白质序列数据库,后者是翻译自EMBL核酸序列的蛋白质数据库,是未经报道过的。
从uniprot的FTP进行下载:
/pub/databases/uniprot/current_release/knowledgebase/complete/uniprot_sprot.fasta.gz
/pub/databases/uniprot/current_release/knowledgebase/complete/uniprot_trembl.fasta.gz
或者从EBI的FTP进行下载:
ftp://ftp.ebi.ac.uk/pub/databases/uniprot/current_release/knowledgebase/complete/uniprot_sprot.fasta.gz
ftp://ftp.ebi.ac.uk/pub/databases/uniprot/current_release/knowledgebase/complete/uniprot_trembl.fasta.gz
或者从Expasy的FTP进行下载:
/databases/uniprot/current_release/knowledgebase/complete/uniprot_sprot.fasta.gz
/databases/uniprot/current_release/knowledgebase/complete/uniprot_trembl.fasta.gz
在这三个FTP服务器的current_release目录下总是放置最新的uniprot版本,可从任一FTP下载。
另外,从UniProt网站还可以下载uniref数据库,这是一个对uniprot蛋白序列进行聚类之后的数据库,去除了冗余数据,也常用于基因注释。
uniref的下载地址如下:
/pub/databases/uniprot/uniref/uniref100/uniref100.fasta.gz
/pub/databases/uniprot/uniref/uniref90/uniref90.fasta.gz
/pub/databases/uniprot/uniref/uniref50/uniref50.fasta.gz
uniref100、uniref90和uniref50分别以100%,90%以及50%的相似度进行聚类。
uniprot的GOA(GO Gene Association)是将uniprot蛋白质序列和GO ID关联的一个文件。GOA Slim则是前者的简要版本。通过该文件可以寻找到每个uniprot序列的GO注释。
uniprot的GOA下载,可从GO的FTP进行下载,地址如下:
文档评论(0)