2011生物信息学复习资料.docVIP

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2011生物信息学复习资料.doc

生物分子序列核心数据库是(Genbank)、(uniprot)、(PDB)。 进行序列比对时,有两方面问题直接影响相似分值,(取代矩阵)和(空位罚分)。 美国国家生物技术信息中心的英文简写是(NCBI) 三大核酸数据库是(genbank)、(embl)、(DDBJ)。 进行序列相似性搜索时候可以到(NCBI)网站上的选择相应的(BLAST),也可以到(EMBL)选择(FASTA)。 进化树主要分为两类,(序列)进化树和(结构)进化树。 基因组不仅是(基因)的简单排列,更重要的是它有独特的(组织)结构和(信息),这种结构是在长期的演化过程中产生的,也是基因发挥功能必须的。 蛋白空间结构的基础是(一级结构)。 人类有(24)种单倍染色体,双倍体为(46)条 在进行引物设计时可选用(NCBI)网站上的(Primer Blast)软件。 蛋白质的二级结构是指蛋白质分子中某一段肽链的局部空间结构,主要为(螺旋、(折叠、(转角、无规则弯曲 在NCBI对蛋白质进行BLAST数据库相似性搜索的输出结果中,结构总览图类出了红、粉、绿、蓝、黑5种颜色,代表同源性最高的颜色是红色 常用打分矩阵有BLOSUM和PAM,其分歧度从低到高的顺序是:BLOSUM 90,BLOSUM 60,BLOSUM 30;PAM30、PAM60、PAM90。 可以进行多序列和进化树分析的软件有:Clustalw 在genbank查询基因的核酸序列可输入:基因名称、基因编码蛋白名称、登录号 、genbank ID 在uniprot查询蛋白序列可输入:编码该蛋白基因名称、蛋白名称、登录号 、ID 生物信息学著名网站是:NCBI、EMBL、ExpASy、PDB 进行重复序列遮蔽的软件有CENSOR、PEPEATMASKER 进行基因预测的软件有Genebuilder、GENSCAN 蛋白空间结构的基础是(一级结构) 可以进行motif和domain比较的软件是prosite NCBI都有哪些数据库:孟德尔人类遗传、三维蛋白质结构的分子模型数据库、特殊人类基因序列集、人类基因组基因图、生物分子浏览器等 生物分子序列核心数据库是(Genbank、SWISS-PROT/TrEMBL、PDB) 生物信息学著名网站:NCBI EMBL EXPASY PDB 名词解释 Clustalw :CLUSTALW是一种渐进的多序列比对方法,先将多个序列两两比对构建距离矩阵,反应序列之间两两关系;然后根据距离矩阵计算产生系统进化指导树,对关系密切的序列进行加权;然后从最紧密的两条序列开始,逐步引入临近的序列并不断重新构建比对,直到所有序列都被加入为止。Alignment:通过查找两个甚至更多序列中相同次序的字符串或字符串模式来对序列进行比较 Blast : Basic Local Alignment Search Tool,对一条或多条序列(可以是任何形式的序列)在一个或多个核酸或蛋白序列库中进行比对对查询序列进行同源性比对工作。Genbank:GenBank是美国国立卫生研究院维护的基因序列数据库,汇集并注释了所有公开的核酸序列。GenBank由位于马里兰州Bethesda的美国国立卫生研究院下属国立生物技术信息中心建立,与日本DNA数据库(DNA Data Bank of Japan ,DDBJ)以及欧洲生物信息研究所的欧洲分子生物学实验室核苷酸数据库( European Molecular Biology Laboratory, EMBL) 一起,都是国际核苷酸序列数据库合作的成员。ExPASY:瑞士生物信息研究所下属的蛋白质分析专家系统(Expert Protein Analysis System,,简称ExPASy)的Web服务器除了开发和维护SwissProt数据库外,也是国际上蛋白质组和蛋白质分子模型研究的中心,为用户提供大量蛋白质信息资源。UniProtKB, PROSITE等数据库以及蛋白质组分析的软件。 FastA格式:是一种基于文本用于表示核苷酸序列或氨基酸序列的格式。在这种格式中碱基对或氨基酸用单个字母来编码,且允许在序列前添加序列名及注释。 序列文件的第一行是由大于号或分号;打头的任意文字说明(习惯常用作为起始),用于序列标记。从第二行开始为序列本身,只允许使用既定的核苷酸或氨基酸编码符号(参见下表)。通常核苷酸符号大小写均可,而氨基酸常用大写字母。日本DNA数据库DDBJ(DNA Data Bank of Japan),于1984年建立,是世界三大DNA 数据库之一,与NCBI的GenBank,EBI的EMBL数据库共同组成国际DNA数据库,每日都 交换更新数据和信息,并主持两个国际年会-国际DNA数据库咨询会议和国际DNA数据 库协作会议,互相交换信息,因此三个

您可能关注的文档

文档评论(0)

ziyouzizai + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档