- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二节 生物信息学及其发展历史 第三节 目前生物信
第二节 生物信息学及其发展历史 概念(狭义) Bioinformatics (1)遗传信息的载体——DNA 遗传信息的载体主要是DNA 控制生物体性状的基因是一 系列DNA片段 生物体生长发育的本质就是遗 传信息的传递和表达 DNA通过自我复制,在生物体的繁衍过 程中传递遗传信息 (3) DNA分子和蛋白质分子都含有进化信息 通过比较相似的蛋白质序列,如肌红蛋白和血红蛋白,可以发现由于基因复制而产生的分子进化证据。 通过比较来自于不同种属的同源蛋白质,即直系同源蛋白质,可以分析蛋白质甚至种属之间的系统发生关系,推测它们共同的祖先蛋白质。 第一部遗传密码已被破译,但对密码的转录过程还不清楚,对大多数DNA非编码区域的功能还知之甚少 对于第二部密码,目前则只能用统计学的方法进行分析 无论是第一部遗传密码,还是第二部遗传密码,都隐藏在大量的生物分子数据之中。 生物分子信息的特征 生物分子信息数据量大 生物分子信息复杂 生物分子信息之间存在着密切的联系 3、生物信息学的发展历史 20世纪50年代,生物信息学开始孕育 20世纪60年代,生物分子信息在概念上将计算 生物学和计算机科学联系起来 20世纪70年代,生物信息学的真正开端 20世纪70年代到80年代初期 ,出现了一系列著 名的序列比较方法和生物信息分析方法 20世纪80年代以后,出现一批生物信息服务机 构和生物信息数据库 20世纪90年代后 ,HGP促进生物信息学的迅速 发展 生物信息学主要研究内容 1、 生物分子数据的收集与管理 2、 数据库搜索及序列比较 3、 基因组序列分析 4、基因表达数据的分析与处理 5、蛋白质结构预测 2、 数据库搜索及序列比较 搜索同源序列在一定程度上就是通过序列比较寻找相似序列 序列比较的一个基本操作就是比对(Alignment),即将两个序列的各个字符(代表核苷酸或者氨基酸残基)按照对应等同或者置换关系进行对比排列,其结果是两个序列共有的排列顺序,这是序列相似程度的一种定性描述 多重序列比对研究的是多个序列的共性。序列的多重比对可用来搜索基因组序列的功能区域,也可用于研究一组蛋白质之间的进化关系。 发现同源分子 3、 基因组序列分析 遗传语言分析——天书 基因组结构分析 基因识别 基因功能注释 基因调控信息分析 基因组比较 4、基因表达数据的分析与处理 基因表达数据分析是目前生物信息学研究的热 点和重点 目前对基因表达数据的处理主要是进行聚类分 析,将表达模式相似的基因聚为一类,在此基 础上寻找相关基因,分析基因的功能 所用方法主要有: 相关分析方法 模式识别技术中的层次式聚类方法 人工智能中的自组织映射神经网络 主元分析方法 5、蛋白质结构预测 蛋白质的生物功能由蛋白质的结构所决定 ,蛋白质结构预测成为了解蛋白质功能的重要途径 蛋白质结构预测分为: 二级结构预测 空间结构预测 二级结构预测 在一定程度上二级结构的预测可以归结为模式识别问题 在二级结构预测方面主要方法有: 立体化学方法 图论方法 统计方法 最邻近决策方法 基于规则的专家系统方法 分子动力学方法 人工神经网络方法 预测准确率超过70%的第一个软件是基于神经网络的PHD系统 空间结构预测 在空间结构预测方面,比较成功的理论方法是同源模型法 该方法的依据是:相似序列的蛋白质倾向于折叠成相似的三维空间结构 运用同源模型方法可以完成所有蛋白质10-30%的空间结构预测工作 关于生物信息学发展历程中的重要大事, 请参见下面两个网站的介绍: /Education /BLASTinfo/milestones.html、 /bioinformatics/。 第三节 生物信息学主要研究内容 基因组 数据库 蛋白质 序列 数据库 蛋白质 结构 数据库 DDBJ EMBL GenBank SWISS-PROT PDB PIR 1、 生物分子数据的收集与管理 基因芯片 层次式聚类 二维电泳图 蛋白质折叠 第四节 生物信息学当前的主要任务 纵观当今生物信息学界的现状,可以发现,大部分人都把注意力集中在基因组、蛋白质组、蛋白质结构以及与之相结合的药物设计上 1. 基因组 1.1 新基因的发现 通过计算分析从EST(Expressed Sequence Tags)序列库中拼接出完整的新基因编码区,也就是通俗所说的“电子克隆”;通过计算分析从基因组DNA序列中确定新基因编码区,经过多年的积累,已经形成许多分析方法,如根据编码区具有的独特序列特征、根据编码区与非编码区在碱基组成上的差异、
您可能关注的文档
- 电子商务基础与应用 - iis7.ppt
- 电梯安全使用 - 温州市特种设备检测研究院.doc
- 疱疹病毒(herpes viruses) - shutcm - 首 页.ppt
- 癌症死亡率交互式网络地图ⅰ: 在线地图集.ppt
- 知识点 隋朝大运河 - 中学历史教学园地—全国文章 .doc
- 知识点2 亚病毒.ppt
- 神奇的海洋世界 - 上海海事大学图书馆.ppt
- 私人银行客户关系管理提纲.doc
- 科技论文写作体会 - pattern recognition & neural .ppt
- 突触动力学ⅱ:有监督学习 - 西安电子科技大学电子 .ppt
- 2025至2030中国移动治疗台行业发展研究与产业战略规划分析评估报告.docx
- 2025至2030链激酶行业细分市场及应用领域与趋势展望研究报告.docx
- 2025至2030爆炸物探测扫描仪行业市场占有率及有效策略与实施路径评估报告.docx
- 2025至2030四川省智能制造行业细分市场及应用领域与趋势展望研究报告.docx
- 2026届高三二轮复习试题政治大单元突破练1生产资料所有制与分配制度含解析.docx
- 2026届高三二轮复习试题政治大单元突破练16哲学基本思想与辩证唯物论含解析.docx
- 2026届高三二轮复习试题政治大单元突破练2社会主义市场经济体制含解析.docx
- 浙江省衢州市五校联盟2025-2026学年高二上学期期中联考技术试题-高中信息技术含解析.docx
- 浙江省金丽衢十二校2026届高三上学期11月联考政治试题含解析.docx
- 2026届高三二轮复习试题政治大单元突破练7领导力量:中国共产党的领导含解析.docx
最近下载
- 产后出血预防及处理指南(2023版)PPT课件.pptx VIP
- 《建筑与市政工程施工质量控制通用规范》(GB-55032-2022).docx VIP
- 骨科质量与安全管理指标.pdf VIP
- 国开电大学习网《农业推广学》形成性考核任务1-3答案.pdf VIP
- 气囊测压表获奖课件.pptx VIP
- 《图形创意》课件之五图形创意的语境.ppt VIP
- 故障分析与故障排除.pdf VIP
- 高中地理湘教版必修 第二册(2019)_农业区位因素 公开课教案课件教学设计资料.pptx VIP
- 大学计算机基础练习题库+答案.docx VIP
- 茶树育种学知到智慧树期末考试答案题库2025年信阳农林学院.docx VIP
原创力文档


文档评论(0)