生物信息学打印(有标注) .docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE 1 单选60、名词解释20、问答题20 第一章 绪论 2000年6月26日,被誉为生命阿波罗计划的人类基因组计划,经过美、英、日、法、德和中国科学家的艰苦努力,终于完成了工作草图,这是人类科学世上又一个里程碑式的事件。 1977年Sanger研究小组完成了第一个噬菌体全基因组的测序,并发现内含子。 1997年,国内第一个生物信息中心北京大学生物信息学中心成立,从此,我国生物信息学研究得到蓬勃发展。 生物信息学可以理解为生物学(或生命科学)和信息学(或计算机科学与应用)的交叉学科。 生物信息学所倡导的全球范围的资源共享将对整个自然科学,乃至整个人类发展产生深远的影响。 “第三次技术革命基因组革命时代,目前它处于初级阶段,一场与工业革命和以计算机为基础的革命有相同影响力的变化正在开始。” 生物信息学产生和迅猛发展的主要推动力来自于新一代测序等高通量技术在生命科学领域越来越广泛的应用。 生物信息学:生物信息学是一门交叉科学,它包含了生物信息的获取、处理、存储、分发、分析和解释等在内的所有方面,它综合运用数学、计算机科学和生物学的各种工具,来阐明和理解大量数据所包含的生物学意义。 第二章 数据库 根据数据库存储的具体内容可分为一级数据库和二级数据库两种类型。 根据数据库存放数据类型的不同,可以分为序列数据库、结构数据库、文献数据库、序列特征数据库、基因组图谱数据库、表达谱数据库等等。 核酸序列数据库常用的有NCBI、EMBL、DDBJ. 常用的蛋白结构数据库有PDB、SCCOP、 GO(gene ontology)语义分分子功能(Molecular Function)、生物学过程(Biological Process)、细胞组件(Cellular Component)三大类。 常见的功能注释数据库GO、IPR和KEGG。 第三章 序列比对 序列比对的常用工具:FASTA、BLAST。 序列比对的常用算法:dotplot、动态规划算法、BLAST算法。 打分矩阵的构建,是基于远距离进化过程中观察到的残基替换率,并用不同的打分值表征不同残基之间相似程度。 常用的打分矩阵:PAM矩阵(Dayhoff突变数据矩阵)、BLOSUM矩阵 序列比对:是运用某种特定的数学模型和算法,找出两个或多个序列之间最大的匹配碱基或残基数目,比对结果反映了算法的多大程度上提供序列之间的相似性关系及它们的生物学特征。 序列比对所使用的参数都有哪些?序列比对的目的是什么? 序列比对(1)发现序列之间的相似性;(2)辨别序列之间的差异 参数包括:分值(打分矩阵)、相似性(%)、同一性(%)、E值 目的:相似序列推测相似的结构,相似的功能 判别序列之间的同源性 推测序列之间的进化关系 同一性:P47 相似性:P47相似性是指序列比对过程中用来描述检测序列和目标序列之间相同DNA碱基或氨基酸残基顺序所占比例的高低。相似性本身的含义,并不要求与进化起源是否同一、与亲缘关系的远近、甚至于结构与功能有什么联系。 第三章 蛋白质序列和结构分析 蛋白质序列分析主要内容包括蛋白质一级序列、蛋白质二级结构、蛋白质超二级结构、蛋白质三级结构、蛋白质分类。 蛋白质的基本性质:相对分子质量、氨基酸组成、等电点(PI)、消光系数、半衰期、不稳定系数、总平均亲水性。 蛋白质二级结构预测的分析流程:1D序列预测、序列基序识别、二硫键识别、无序结构识别、折叠子识别、残基接触预测、结构域预测、结构表面识别。 蛋白质三级结构的预测方法:同源建模法( Homology/Comparative modelling ) 、串线法/折叠识别法(Threading/Fold recognition)、从头预测法( Ab initio/De novo methods )三种方法。 结构域的常见数据库有 prosite、smart、IPR 常见的蛋白质二级结构包括哪些?P67 第四章 基因组注释 蛋白质编码基因注释的三种方法:基于证据的基因注释、从头开始的基因预测、证据与基因自身结构特点相结合 何为基因组注释?目前基因组注释的内容包括哪些? 确定基因组中每一个核苷酸的生化和生物学功能。一个完整的基因组注释包括在基因组中鉴定出各类功能元件,如编码蛋白质的基因、RNA基因、重复序列和假基因等,并确定这些元件对应的生物学功能:(1)确定蛋白质编码基因及其外显子-内含子结构(基因结构),并推断生物学功能;(2)进行RNA基因的预测,并推断其功能和相互作用靶标分子;(3)确定重复序列的含量和分类;(4)进行假基因的识别和分类。 第五章 分子进化 分子进化的研究目的:(1)从物种的一些分子特性出发,构建系统发育树,进而了解物种之间的生物系统发生关系;(2)大分子功能与结构的分析;(3)进化速率的分析 利用生物

文档评论(0)

雪憨 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档