- 1、本文档共64页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
第1章生物信息学背景知识DNA分子结构基因结构蛋白质基因表达生物信息数据库DNA分子结构构成DNA分子的基本单位脱氧核苷酸(碱基、核糖和磷酸)脱氧核苷酸通过一定的化学键连接起来形成脱氧核苷酸链四种核苷酸嘌呤:腺嘌呤(adenineA)鸟嘌呤(guanineG)嘧啶:胞嘧啶(cytosineC)胸腺嘧啶(thymineT)DNA分子结构DNA分子结构基因结构基因隐藏在DNA序列中的遗传密码一个DNA分子上可能有多个基因一个基因所对应的核苷酸序列区域,被称为编码区,非基因区域对应的核苷酸序列称为非编码区因为编码区的核苷酸序列将根据一定的规则来控制蛋白质的合成过程基因的变异将产生错误的蛋白质合成结果基因结构基因目前对非编码区序列分析研究十分活跃生物学家认为非编码可能会与各种疾病发生关联在非编码区,存在大量的重复序列,目前对重复序列的查找算法研究非常活跃TandemRepeats:形如??这样的字符串例如:ACGTACGT,GCCGCCGCCGCCApproximateTandemRepeats:形如?1?2这样的字符串,?1?2之间具有一定的相似性要求GeneralRepeats:形如(?)n这样的字符串,n1.?称为pattern基因结构一般一个基因并不是一个连续的核苷酸串,并具有一定的结构基因结构大多数真核细胞基因的显著特征是有非编码的插入序列,称为内含子(intron)内含子能够转录成RNA,在翻译成蛋白质之前被加工剪接,因此不包含在mRNA序列中基因结构被内含子隔开的编码序列为外显子(exon),剪接后连在一起形成成熟的mRNA,参与指导蛋白质合成不同基因的内含子和外显子数目和大小不同,一般基因越大,外显子越多。内含子可能远远大于外显子,也可能内含子中包含其他基因的编码序列,即基因内基因基因结构启动子(promoter)一般位于基因转录启始点上游100-200bp范围,是能与DNA聚合酶和转录因子相互作用的核苷酸序列,包含一些DNA序列元件TATA框:人类许多基因在转录启始点5’端上游-19~-27bp处有一段高度保守序列,又称-10region。由7个碱基组成,TATAA/TAA/T,其中两个碱基可以变化。TATA框能与转录因子TFII结合,再与RNA聚合酶II形成复合物,准确识别转录启始点,启动基因转录基因结构启动子(promoter)CAAT框:位于转录启始点5’端上游-70?-80bp处有一段高度保守序列,由9个碱基组成,GGGC/TCAATCA,其中一个碱基可以变化。CAAT框能与转录因子CTF结合,提高转录效率GC框:有一些基因没有TATA框和CAAT框,但存在富含G和C核苷酸的序列;GC框是由GGCGGG组成,能与转录因子Spl结合,促进转录过程基因结构增强子(enchancer):是一个短序列元件,结合于转录因子,能增强基因的转录活性。可位于基因的任何位置,其功能与位置和序列方向无关。结合增强子的蛋白可和结合启动子的蛋白相互作用,增强基因表达终止子(terminater):是由AATAAA和一段回文序列组成,AATAAA是多聚腺苷酸(polyA)的附加信号,回文序列转录后形成发夹结构,阻碍RNA聚合酶继续移动,转录终止基因结构一个简单的核苷酸序列编码蛋白质蛋白质是一种生物大分子,基本上是由20种氨基酸以肽键连接成肽链蛋白质蛋白质分子结构多样性组成蛋白质的氨基酸分子的种类不同组成蛋白质的氨基酸分子的数量成百上千组成蛋白质的氨基酸分子的排列次序变化多端蛋白质分子的空间结构不同蛋白质蛋白质分子结构多样性?功能多样性有些蛋白质是构成细胞和生物体的重要物质如人和动物的肌肉主要是蛋白质有些蛋白质有催化作用如参与生物体各种生命活动的绝大多数酶有些蛋白质有运输作用如细胞膜上的载体、红细胞中的血红蛋白有些蛋白质有调节作用如胰岛素和生长激素都是蛋白质,能够调节人体的新陈代谢和生长发育有些蛋白质有免疫(包括细胞识别)作用如动物和人体的抗体能清除外来蛋白质对身体生理功能的干扰,起着免疫作用蛋白质蛋白质是生物生命活动中的一种非常重要的物质基础基因密码?可以推演出组成某种蛋白质的氨基酸序列基因序列与蛋白质功能之间存在某种联系通过基因序列推演蛋白质氨基酸序列的技术已经成熟蛋白质生物学功能取决于其空间结构研究每一种蛋白质的空间结构,成为后基因组时代的制高点,也就是结构基因组学的基本任务蛋白质
您可能关注的文档
- 人教部编版七年级上册语文文学常识与课文总结.docx
- 必修三第22课孙中山的民主追求.pptx
- 《学画山水画》美术教案.docx
- 中国古典园林建筑设计第三章 园林建筑群体设计.pptx
- 我在未来等你读后感1000字.docx
- 参加危险化学品经营单位安全管理人员复培考试不及格的个人检讨书.docx
- oracle课程设计--图书管理系统.docx
- 研究生自然辩证法复习题答案.docx
- 基层事业单位党建思想政治工作创新探析.docx
- 教师资格考试学科知识.docx
- 2025年贵州工业职业技术学院高职单招高职单招英语2016-2024历年频考点试题含答案解析.docx
- 2025年西昌民族幼儿师范高等专科学校高职单招职业适应性测试近5年常考版参考题库含答案解析.docx
- 2025年西藏警官高等专科学校高职单招语文2018-2024历年参考题库频考点含答案解析.docx
- 2025年贵州工商职业学院高职单招职业技能测试近5年常考版参考题库含答案解析.docx
- 2025年贵州工商职业学院高职单招职业适应性测试近5年常考版参考题库含答案解析.docx
- 2025年贵州农业职业学院高职单招数学历年(2016-2024)频考点试题含答案解析.docx
- 2025年贵州工商职业学院高职单招高职单招英语2016-2024历年频考点试题含答案解析.docx
- 2025年贵州工商职业学院高职单招语文2018-2024历年参考题库频考点含答案解析.docx
- 2025年许昌职业技术学院高职单招数学历年(2016-2024)频考点试题含答案解析.docx
- 2025年许昌职业技术学院高职单招职业技能测试近5年常考版参考题库含答案解析.docx
文档评论(0)