生物信息学题库课题.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
生物信息学题库 一、名词解释 1、生物信息学:生物分子信息的获取、存贮、分析和利用;以数学为基础,应用计算机技术,研究生物学数据的科学。 2、相似性(similarity):相似性是指序列比对过程中用来描述检测序列和目标序列之间相同DNA碱基或氨基酸残基顺序所占比例的高低。 3、同源性(homology):生物进化过程中源于同一祖先的分支之间的关系。 4、BLAST(Basic Local Alignment Search Tool):基本局部比对搜索工具,用于相似性搜索的工具,对需要进行检索的序列与数据库中的每个序列做相似性比较。 5、HMM隐马尔可夫模型:是蛋白质结构域家族序列的一种严格的统计模型,包括序列的匹配,插入和缺失状态,并根据每种状态的概率分布和状态间的相互转换来生成蛋白质序列。 6、一级数据库:一级数据库中的数据直接来源于实验获得的原始数据,只经过简单的归类整理和注释(投稿文章首先要将核苷酸序列或蛋白质序列提交到相应的数据库中) 7、二级数据库:对原始生物分子数据进行整理、分类的结果,是在一级数据库、实验数据和理论分析的基础上针对特定的应用目标而建立的。 8、GenBank: 是具有目录和生物学注释的核酸序列综合公共数据库,由NCBI构建和维护。 9、EMBL:EMBL 实验室——欧洲分子生物学实验室,EMBL 数据库——是非盈利性学术组织 EMBL 建立的综合性数据库,EMBL 核酸数据库是欧洲最重要的核酸序列数据库,它定期地与美国的 GenBank、日本的 DDBJ 数据库中的数 据进行交换,并同步更新。 10、DDBJ: 日本核酸序列数据库,是亚洲唯一的核酸序列数据库。 11、Entrez:是由 NCBI 主持的一个数据库检索系统,它包括核酸,蛋白以及 Medline 文摘数据库,在这三个数据库中建立了非常完善的联系。 12、SRS(sequence retrieval system):序列查询系统,是 EBI 提供的多数据库查询工具之一。有与 Entrez 类似的功能外,还提供了一系列的序列分析工具,可以直接进行在线序列分析处理。 13、EST:收集大量cDAN或EST序列以及其他相关信息,目前最大的一个公共表达序列数据库。 14、GSS:GeneBank数据库的一部分,收集基因组DNA克隆的测序序列。 15、GEO:基因表达精选集是一个储存高通量功能基因组学数据的数据库。 16、SCOP数据库:提供关于已知结构的蛋白质之间结构和进化关系的详细描述,包括蛋白质结构数据库PDB中的所有条目。 17、PROSITE :是蛋白质家族和结构域数据库,包含具有生物学意义的位点、模式、可帮助识别蛋白质家族的统计特征。 18、RefSeq: 是一个收录注释过的非冗余转录本、蛋白质和基因组序列的数据库。 19、Structure domain:结构域,是在蛋白质三级结构中介于二级和三级结构之间的可以明显区分但又相对独立的折叠单元。 20、ORF:开放阅读框,位于DNA或RNA上起始密码子与终止密码子之间的序列。 21、Promoter:启动子是基因的一个组成部分,是位于结构基因5‘端上游区的DNA序列,控制基因表达(转录)的起始时间和表达的程度。 22、3’UTR:3’非翻译区的缩写,真核生物的转录终止信号是在 3’非翻译区的 : polyA。 23、CpG island:是在哺乳动物基因组中的一个500bp到300bp的区域,富含GC。 24、Motif:又称模体,蛋白质序列中短的保守区域,它们是结构域中保守性很高的部分。25、PDB(Protein?Data?Bank):蛋白质结构数据库,是国际上著名的生物大分子结构数据库,由美国Brookhaven国家实验室建立。 26、打分矩阵(scoring?matrix):在相似性检索中对序列两两比对的质量评估方法。包括基于理论(如考虑核酸和氨基酸之间的类似性)和实际进化距离(如PAM)两类方法。 27、遗传连锁图:又叫遗传图谱(genetic map)是以具有遗传多态性的遗传标记为“路标”,以遗传学距离为图距的基因组图。 28、蛋白质组(proteom):是指一个基因组、一种生物或一个细胞/组织的基因组所表达的全套蛋白质。 29、基因组学:研究生物基因组和如何利用基因的一门学问。 30、比较基因组学:是在基因组图谱和测序的基础上,利用某个基因组研究获得的信息推测其他原核生物、真核生物类群中的基因数目、位置、功能、表达机制和物种进化的学科。 二、填空 1、1970: Needleman和Wunsch提出了著名的 序列比对算法 ,是生物信息学发展中最重要的贡献。 2、20世纪90年代后, HGP 促进生物信息学的迅速发展。 3、HGP选择作为研究人类的四大“模式生

文档评论(0)

妈妈王子 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档