- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
ok第四讲 提交序列和序列的分析
1、序列数据提交途径方式和方式 提交单位:1. The National Center for Biotechnology Information(NCBI)();2. The DNA Databank of Japan(DDBJ)(www.ddbj.nig.ac.jp);3. The Europe Molecular Biology Laboratory(EMBL)/ EBI Nucleotide Sequence Database (http://www.embl-heidelberg.de)。 网页提交:/BankIt 。 通过Sequin软件提交(Ftp:///sequin)。 Email:gbsub@ 磁盘邮寄:GenBank Submissions, National Center for Biotechnology Information, National Library of Medicine, Bldg. 38A, Room 8N-803, Bethesda, Maryland 20894。 悠悠的人类文明库,将留下你给后人提供的科学财富 ! 2、序列精度要求 DNA测序过程中的精度要求是相当高的,需要大量的时间和开支。在提交到GenBank等数据库之前都没有经过序列精确度的检测程序。常常序列在被某刊物上发表的同时被提交到数据库,得到了该刊物某种程度的检测。然而许多序列是在没有发表或还没有发表的情况下提交了。 对于完成诸如Human Genome Project大型测序工程的实验室,必须确保精度在1 error/10kb以内。这种精度对于绝大多数序列分析来说是足够的。而对于其他一般的实验室,其测序精度可能非常低(如EST测序),约1/100,包括错误碱基以及碱基的错误插入或删除。 在翻译GenBank等数据库中EST序列的过程中,错误的碱基可能被翻译成错误的氨基酸。然而,最严重的问题是碱基的插入或删除引起的序列结构上的移位,这将在组装蛋白质的过程中出现很大的困难。 另外一种类型容易出错的数据库序列,即从致病生物体中出现免疫变化的序列片断,例如HIV病毒的蛋白质外壳的区域。 虽然低水平的精确度对定性鉴别等研究工作是适合的,但要进行更精细的分析(比如进化分析),序列片断的精度必须得到保证。 3、序列的计算机存储 在序列分析程序中,必须确保序列文件仅包含一般的序列符号,而不包括文本编辑器所使用的特殊字符,这一点很重要。绝大多数文本编辑器在输入标准的ASCII字符的同时还会输入一些控制字符。这些控制字符只能被文本编辑程序正确识别。如果序列文件中包括这些控制字符,分析就会出错,当然这还取决于序列分析程序能否将它们过滤掉。编辑器通常仅用标准的ASCII字符来保存文件,这些文件将适用于绝大多数序列分析程序。 序列文件和其他包含非ASCII字符的数据文件也会在不同的机器之间传递过程中出现错误。一些通信软件可以设法忽略这些控制字符。例如,文件传输程序(FTP) 拥有可以由用户设置的ASCII和二进制码两种方式。其中ASCII方式常用于传输文本文件,而二进制码方式用来传输包含非ASCII码的压缩文件。 大多数序列分析程序不仅仅需要一个DNA或蛋白序列文件是标准的ASCII文件,而且还要规定特定的格式。计算机的窗口界面大大简化了这些问题,比如操作者仅仅需要在一个窗口(例如在浏览ENTREZ网页的窗口)中进行拷贝,而在另一个窗口(例如正在运行翻译程序的窗口)中进行粘贴。 序列分析常用方法小结 1、Genomic DNA and cDNA, 利用ORF Finder软件发现开放阅读框ORF(Open reading frame)。 网址:/gorf 2、编码蛋白质中的氨基酸序列蛋白质结构域预测:利用SMART(Simple Modular Rrvhitecture Research Tool)软件。 网址:http://smart.embl-heidelberg.de “授之以鱼,不如授之以渔。” 3、利用ScanProsite软件,进行蛋白质基序(motif)预测。 网址:/tools/scanprosite 蛋白质基序(motif)中的x表示任意氨基酸,其中的数字表示任意几个氨基酸;[ST]表示氨基酸为S or T;{P}表示除掉P之外的任意氨基酸。 如: ID ASN_GLYCOSYLATION; PATTERN. AC PS00001;DT APR-1990 (CREATED); APR-1990 (DATA UPDATE); APR-1990 (INFO UPDATE). DE N-glycosylation site. PA N-{P}-[ST]-{P}. CC /TAXO
您可能关注的文档
- 2017-2018年高中生物第一单元生物技术与生物工程第二章细胞工程第5节克隆技术课件.ppt
- 2016高三一轮 孟德尔的豌豆杂交实验一.ppt
- 2016年春人教版八年级生物下册课件:第八单元-第三章-第二节-选择健康的生活方式(共31张).ppt
- 2016高中政治(课件)2-4-1第1框 世界的物质性(人教版必修4).ppt
- 2017.07.28新生儿心肺复苏更新指南解读.ppt
- 2017-8.1金属材料 课件26..ppt
- 2017《优化方案》高考化学(苏教版)一轮复习课件专题9有机化合物第二单元.ppt
- 2017年卓越学案高中同步导学案·物理(人教版选修3-3)课件第七章 分子动理论第二节.ppt
- 2017版高三生物苏教版一轮复习课件5.2基因在染色体上、伴性遗传..ppt
- 2017高中生物第2章基因和染色体的关系第2节基因在染色体上课件.ppt
最近下载
- 新人教版高中数学必修第二册统计全套课件.pptx VIP
- 台球厅消防安全应急预案.docx VIP
- 海外代理协议合同协议.docx VIP
- 初中教科研课题:《初中语文预习方法研究》课题研究工作报告.doc VIP
- 2025至2030年中国新疆维吾尔自治区建筑市场运行态势及行业发展前景预测报告.docx
- 简述10KV 高压配电柜安装.doc VIP
- GB50148-2010 电气装置安装工程电力变压器油浸电抗器、互感器施工及验收规范.pdf VIP
- 2025航天恒星科技有限公司招聘80+人笔试历年参考题库附带答案详解.pdf
- RB∕T 174-2021 司法鉴定法庭科学机构能力专业要求.pdf
- CP-717安装指南.doc VIP
文档评论(0)