2016年电大 -生物信息学考试重点.docVIP

下载本文档

3
0
约6.79千字
约 13页
2016-09-19 发布于湖南
举报
版权申诉

2016年电大 -生物信息学考试重点.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

2016年电大 -生物信息学考试重点

生物信息学：生物信息学包含了生物信息的获取、处理、分析、和解释等在内的一门交叉学科；它综合运用了数学、计算机学和生物学的各种工具来进行研究；目的在于阐明大量生物学数据所包含的生物学意义。 BLAST 直译：基本局部排比搜索工具意译：基于局部序列排比的常用数据库搜索工具含义：蛋白质和核酸序列数据库搜索软件系统及相关数据库 PSI-BLAST：是一种迭代的搜索方法，可以提高BLAST和FASTA的相似序列发现率。一致序列：这些序列是指把多序列联配的信息压缩至单条序列，主要的缺点是除了在特定位置最常见的残基之外，它们不能表示任何概率信息。 HMM隐马尔可夫模型：是蛋白质结构域家族序列的一种严格的统计模型，包括序列的匹配，插入和缺失状态，并根据每种状态的概率分布和状态间的相互转换来生成蛋白质序列。信息位点：由位点产生的突变数目把其中的一课树与其他树区分开的位点。非信息位点：对于最大简约法来说没有意义的点。标度树：分支长度与相邻节点对的差异程度成正比的树。非标度树：只表示亲缘关系无差异程度信息。有根树：单一的节点能指派为共同的祖先，从祖先节点只有唯一的路径历经进化到达其他任何节点。无根树：只表明节点间的关系，无进化发生方向的信息，通过引入外群或外部参考物种，可以在无根树中指派根节点。注释：指从原始序列数据中获得有用的生物学信息。这主要是指在基因组DNA中寻找基因和其他功能元件（结构注释），并给出这些序列的功能（功能注释）。聚类分析：一种通过将相似的数据划分到特定的组中以简化大规模数据集的方法。 ESI电喷雾离子化：一种适合大分子如蛋白质离子化没有明显降解的质谱技术。样品溶解后从高电压控制下的细针中喷出，形成的带电荷微小液滴从一个小孔直接进入质谱仪的真空室中，在其钟被一股惰性气体干燥形成气态离子，这些气态离子从分析仪向探测器加速（飞行）。机制辅助的激光解析离子化（）：这一技术通过质谱产生离子，这适合于没有降解的大蛋白质的分析。虚拟细胞：一种建模手段，把细胞定义为许多结构，分子，反应和物质流的集合体。先导化合物：是指具有一定药理活性的、可通过结构改造来优化其药理特性而可能导致药物发现的特殊化合物。就是利用计算机在含有大量化合物三维结构的数据库中，搜索能与生物大分子靶点匹配的化合物，或者搜索能与结合药效团相符的化合物，又称原型物，简称先导物，是通过各种途径或方法得到的具有生物活性的化学结构权重矩阵（序列轮廓）：是一种描绘蛋白质结构域家族相序列的方法。它们表示完全结构域序列，多序列联配中每个位点的氨基酸都有分值，并且特定位置插入或缺失的可能性均有一定的衡量方法。（课件定义）基础上针对特定的应用目标而建立的数据库。系统发育学（phylogenetic）：确定生物体间进化关系的科学分支。系统生物学（systems biology）：是研究一个生物系统中所有组分成分（基因、mRNA、蛋白质等）的构成以及在特定条件下这些组分间的相互关系，并分析生物系统在一定时间内的动力学过程蛋白质组（proteome）：是指一个基因组、一种生物或一个细胞/组织的基因组所表达的全套蛋白质。进化树：物种的进化被表现成为一系列的分叉，并符合分类理论，这些树就叫做进化树。 DBGET/LinkDB：由日本的化学研究所和人类基因组中心所开发的在线数据检索工具。也见Entrez，SRS。 ”符号相隔，第一行没有长度限制。值得注意的是FASTA文件允许以小写字母表示氨基酸。文件扩展名为“.fasta”。 NBIR/PIR序列格式：第一行以“”开头，后面紧跟两字母编码（P1代表蛋白质序列，N1代表核酸），再接一个分号，分号后紧跟序列标识号。后面是说明行，该行可长可短，没有长度限制。接下来是序列本身，以“*”号终止。文件的扩展名为“.pir”或“.seq”。 GDE序列格式：与FASTA的格式基本相同，但行首为“%”，文件扩展名为“.gde”。） 2. BLAST的五个子程序（1）Blastp，用蛋白质查询蛋白质序列，可以找到具有远源进化关系的匹配序列，方法是用待搜索蛋白序列与蛋白数据库比较。（2）Blastn，用核苷酸查询核苷酸序列，适合寻找分值较高的匹配，不适合远源关系，待搜索核酸序列与核酸数据库比较（3）Blastx，用蛋白质查询已翻译核苷酸序列，适合新DNA序列和EST序列的分析，将待搜索核酸序列按6个读框翻译成蛋白质序列，然后与数据库中的蛋白质比较。（4）Tblastn，用已翻译核苷酸查询蛋白质，适合寻找数据库中尚未标注的编码区，将数据库中核酸序列按6个读框翻译成蛋白序列，然后与待搜索蛋白序列对比。（5）Tblastx，用已翻译核苷酸查询已翻译核苷酸序列。适合分析EST序列，无论是待搜索核酸序列