- 1、本文档共59页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
生物信息学概述;一.生物信息;生物分子信息;遗传信息的载体——DNA;DNA;生命机器的执行者--蛋白质;DNA分子和蛋白质分子都含有进化信息;生
物
分
子
信
息;?;第一部遗传密码已被破译,但对密码的转录过程还不清楚,对大多数DNA非编码区域的功能还知之甚少
对于第二部密码,目前则只能用统计学的方法进行分析。破译“第二遗传密码”:即折叠密码(foldingcode),从蛋白质的一级结构得到立体结构,即可直接从基因推测其编码蛋白质所对应的生物学功能。破解折叠密码被列为“21世纪的生物学”的重要课题。;Bioinformatics,生物+信息+学
--新兴的交叉学科;定义一:生物信息学是一门收集、分析遗传数据以及分发给研究机构的新学科(1987)
定义二:生物信息学特指数据库类的工作,包括持久稳固的在一个稳定的地方提供对数据的支持(1994)
定义三:采用信息科学技术,对各种生物信息(包括核酸、蛋白质等)的收集、加工、储存、分析、解释的一门学科。
收集、加工、储存:计算机科学家
分析、解释:生物学家;三、生物信息学发展简史;1967:Dayhoff研制出蛋白质序列图集,即后来著名的蛋白质信息源PIR;
1970:Needleman和Wunsch提出了著名的序列比对算法,是生物信息学发展中最重要的贡献;
1978:Gingeras等人研制了核酸序列中酶切位点识别程序;
1981:Doolittle提出了关于序列模式的概念;
1986:日本核酸序列数据库DDBJ诞生;
1986:蛋白质数据库SWISS-PROT诞生;
1988:美国国家生物技术信息中心NCBI诞生;
1988:成立欧洲分子生物学网络(EMBNet),EMBL数据库诞生
;(二)基因组时代的生物信息学;人类基因组计划开始
(HumanGenomeProject,HGP)
人类基因组计划带来了
生物信息学;人类基因组计划
(HGP,HumanGenomeProject)
目标:整体上破解人类遗传信息的奥秘;基因组(Genome):
包含细胞或生物体全套的遗传信息的全部遗传物质
包括:
细胞核基因组DNA
细胞质(线粒体、叶绿体)基因组DNA
;;曼哈顿原子弹计划;AttheWhiteHouseonJune26,FrancisCollins(r),DirectoroftheNationalHumanGenomeResearchInstitute,PresidentClinton,andJ.CraigVenter,PresidentofCelaraGenomics,laudedthethousandsofscientistswhocontributedtothegenomesequence.
;2001年2月15日《Nature》封面;我国对人类基因组计划的贡献;24;;human;;数据库中的蛋白质序列;29;四、生物信息学的研究领域;
大规模核酸测序及拼接
基因识别与定位
基因相关的SNP研究
非编码区信息结构分析
比较基因组学;大规模基因组测序;33;运用计算机软件进行序列拼接;基因识别与定位;基因相关的SNP研究:
单核苷酸多态性(SingleNucleotidePolymorphisms,SNP):主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性。它是人类可遗传的变异中最常见的一种。占所有已知多态性的90%以上。SNP在人类基因组中广泛存在,平均每500~1000个碱基对中就有1个,估计其总数可达300万个甚至更多。;SNP的研究意义
寻找疾病相关的突变位点
法医学研究
器官移植中供体/受体配对分析
;全基因组关联分析(Genome-wideassociationstudy,GWAS):是指在人类全基因组范围内找出存在的序列变异,即单核苷酸多态性(SNP),从中筛选出与疾病相关的SNPs;非编码区信息结构分析:基因表达调控分析
在微生物中,非编码区只占整个基因组序列的10%-20%;但在高等生物和人类基因组中,非编码序列则占了基因组序列的绝大部分。在人的基因组中,非编码序列超过95%。非编码区有调控作用的核苷酸序列,包括位于编码区上游的RNA聚合酶结合位点。;比较基因组学(ComparativeGenomics)是基于基因组图谱和测序基础上,对已知的基因和基因组结构进行比较,来了解基因的功能、表达机理和物种进化的学科;(二)蛋白质及蛋白质组
文档评论(0)