1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
sequin使用

Sequin3.0是NCBI为了方便各国参与测序工作的分子生物学研究人员将序列输入到由Genbank,EMBL,DDBJ联合组成的国际协作核酸序列数据库 (International Nucleotide Sequence Database Collaboration)而设计的一个客户端软件,使用户可以不需要上网就能够实现序列输入,格式的定制,和在序列数据库中的注册、修改、更新。与其他的输入方法,如NCBI提供的另外一种在线序列注册工具Bankit相比,Sequin提供许多自动处理功能对序列进行格式定制,避免了手工输入的麻烦和格式不统一,并且,在大量相关数据输入时,Sequin可以方便的直接根据各个序列前的数据行读入各个序列的注释信息。Sequin3.0是该程序的最新版本,与上一个版本2.9相比,3.0修改了程序的网络配置功能,解决了位于防火墙后的一些用户无法用该程序联网的问题。另外对在2.9版本中发现的一些小的BUG也作了修正。 该程序具体的序列输入操作包括简单模式和复杂模式两种: 一.简单模式:打开Sequin3.0可进入如下开始界面,然后选择了需要进行数据注入的数据库后就可以开始序列输入,对各个数据库序列输入的过程中信息填写都是一样的,只是最终生成的数据格式互不相同。 序列的具体输入过程是下面几个界面,按照要求填写即可: 这一页是填写序列引用信息,包括文章(稿件)名,通讯作者联系方式,前三个作者列表,和作者所属机构。 这一页是选择所注入的序列的格式,程序会根据不通格式直接自动读入生成一些序列注释信息。 最后这页是输入序列,在上一页中选择不通格式,页面会有所不同,主要是表明序列的来源,包括来源物种的种属名,菌株号或克隆系列号等,对多序列还要进行注释,输入序列时是使用FASTA格式进行导入,即将各序列按照如下的FASTA格式加上序列头信息后保存成文本格式的文件再导入到Sequin中。 核酸:ID [org=scientific name] [strain=name][clone=name] title 蛋白:ID [gene=symbol] [prot=name] title 这样就完成了序列的简单输入,进入到以下的提交界面: 这时可以利用程序提供的自动检查功能(Search菜单中的Validate命令)对输入的序列格式进行检查,之后向数据库提交可以通过三种方式: 1.用File菜单中的Prepare submission将输入的序列及注册信息合成为提交文件,之后再用Email发给各个数据库的收件信箱 Genbank: gb-sub@ EMBL: datasub@ebi.ac.uk DDBJ: ddbjsub@ddbj.nig.ac.jp 2.用File菜单中Submit to NCBI来发送。 3.直接点击界面上部的按钮。 二.在这个界面中也可以按照利用Sequin提供的各种工具对提交的序列及注释信息作进一步的修改,之后再作提交。其主要的工具有: 利用Search菜单中的ORF Finder搜索序列中潜在的编码区;利用Vector Screen去除序列中的可能存在 载体序列;Repeat Finder搜寻序列中重复序列。以及对序列的注释信息的搜索编辑。 在进行了以上的分析后可以利用Annote菜单中的各个选项对序列的序列的注释信息进行详细的编辑,包括注释序列中各种位点,片断,以及整个序列的详细来源等,并可在注释中标出序列的各种特征序列,即纹基(motif)。另外还可在文章发表后在对序列的发表信息作进一步的修改。 Sequin还提供了对序列进行编辑的窗口,在该窗口中也可以对序列进行适当的分析和转译,并能将其他相关序列导入进行序列对准比较,找出具有同源性的区段三.Sequin的其他功能。 处理专业的提供对各序列数据库的序列输入功能外,Sequin也结合其NCBI的ENTREZ搜索引擎和BLAST搜索引擎,提供了对NCBI的其他数据库的检索和同源性比较的程序,通过开始界面上或提交界面上的的Misc菜单即可进入右边的ENTREZ界面,利用这一界面可以方便的对Genbank中的MEDLINE文献数据库,核酸序列,蛋白序列,蛋白三维结构和基因组序列数据库进行检索而不需要到NCBI的网站。检索方法和在NCBI网站一样,十分简单易用。检索得到的文献和序列结果可直接保存成文本,而蛋白三维结构则可以利用NCBI提供的另外一个软件Cn3D来观看。(关于Cn3D的介绍另有其文,这里就不在赘述) 而通过提交界面的Search菜单中的Power BLAST命令可以进入到以下的BLAST同源性比较搜索界面: 该程序提供了四种检索程序,包括对核酸序列搜索的blastn,tblastn和对蛋白序列搜索的blastp,blastx。并根据需要

文档评论(0)

zhuwenmeijiale + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:7065136142000003

1亿VIP精品文档

相关文档