- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
郜刚生物信息学-03-1-生物信息学的引论
生物信息学的研究第三个方面是开发分析工具和实用软件,解决具体的问题,为具体的生物信息学应用服务,例如,开发生物分子序列比较工具、基因识别工具、生物分子结构预测工具、基因表达数据分析工具等。 生物信息处理的流程 实验 信息 数据 知识 收集 计算机化 表示 特征分析 建模 推理 应用 基因工程 蛋白质设计 病理分析 药物开发 等 目前已经得到的各类数据量及生物信息学对各类数据处理的基本任务 数据源 数据量 生物信息学任务 DNA序列 3000万条序列 400.0 亿个碱基 分离编码与非编码区域 识别内含子与外显子 基因产物预测 基因功能注释 基因调控信息分析 蛋白质序列 100万条序列 序列比较 多重序列比对 识别保守的序列模式 进化分析 大分子结构 2.5 万个结构 二级结构、空间结构预测 三维结构比对 蛋白质几何学度量 表面和形态计算 分子间相互作用分析 分子模拟 目前已经得到的各类数据量及生物信息学对各类数据处理的基本任务 数据源 数据量 生物信息学任务 基因组 1300个基因组 (其中大量是病毒和微生物基因组) 标注重复序列 基因结构分析 系统发生分析 基因与疾病的连锁分析 基因组比较 遗传语言分析 基因表达 海量 基因表达模式相关分析 基因调控网络分析 表达调控信息分析 生物信息学的相关杂志 生物信息学面临的8大挑战 基因组序列及其表达情况。 主要指RNA层面的分析。如Riboswitch RNAs:主要定位于基因的5’非转录端附近,能够感知代谢物并调控基因表达。 (1) 在基因组中,究竟有多少具有功能性的和结构性的RNA? (2) 转录和剪切。人中大约23,000个基因,水稻大约是人的两倍(~50,000)。推测,可变剪切(Alternatively Splicing)可能在其中起着重要的作用。 (3) 剪切的分子机器通过识别何种机制来调控基因的可变剪切?通过计算需要解决的问题:成熟的RNA是怎样的?它们的表达是如何受到调控的?在细胞层面上,不同剪切异构体的表达有着什么样的影响? 53个人的线粒体基因组(16,587bp) Out of Africa 1. 人类(现代智人)大约起源于100,000~200,000年前 2. ~45,000年前走出非洲。 3. 根据线粒体基因组构建进化树,进行系统发育树的分子进化分析。 4. 线粒体:母系遗传。 5. 夏娃:黑人! 6. 人类迁移的历史。 人类迁移的路线 2. 人类基因组研究 (1) 与其他物种相比,哪些基因是人类所特有的?目前研究:两类,与语言相关或者大脑的发育有关。 (2) 能否系统的计算出这些基因?以及推测其功能,为进一步的实验作指导? (3) 人的进化过程是怎样的?在什么时候,决定人类物种形成的基因是如何产生的?走出非洲? 3. 遗传密码的延伸和拓展: 共价修饰、环境因素及表观遗传学。遗传密码不仅包括确定蛋白质的序列,还包括蛋白质的共价修饰。~10%的基因表达执行修饰功能的酶。 (1) 在何等程度上遗传因素决定了生物体的表型?在何等程度上环境因素起着另一层的作用?是否可以将环境因素看成是“代谢组学”,即细胞或生物体中的分子组分的特定性? (2) 我们能否推测究竟哪个激酶磷酸化哪个底物?哪个泛素连接酶负责哪个底物的降解?这些底物都具有什么样的功能? (3) 能否通过生物信息学的方法来研究“histone code”? 蛋白质的翻译后修饰 1. 侧链上,酶催化依赖,功能小分子或蛋白质 - 单个氨基酸,共价结合。例如:磷酸化、SUMO化、棕榈酰化、糖基化、甲基化以及泛素化,等。 2. 主链上,蛋白酶介导的共价键断裂。例如,丝氨酸蛋白酶(thrombin),caspase对底物的裂解修饰。 Phosphorylation Sumoylation Palmitoylation Acetylation Ubiquitination 蛋白质的翻译后修饰 4. 一维的遗传编码,如何实现三维的世界? 4. 一维的遗传编码,如何实现三维的世界? DNA-RNA-蛋白质,线形的一维序列转变成三维的结构和分子机器,能否通过序列来预测蛋白质的结构? (1) 非共价的作用在计算最低自由能种有着何等意义?如何进行描述?给定一个结构设计序列为何比给定一个序列来预测结构更为容易? (2) 基因组的信息如何与能量的因素结合起来,进行蛋白质三级结构的预测? (3) 热动力学的假设对于Amyloid-like fibers以及其他错误折叠的蛋白质,是否适用? 5. 细胞的功能及仿真模拟,系统生物学研究。蛋白质之间以及蛋白质与小分子之间的相互作用。 (1) 多大程度上,我们能够通过蛋白质的序列去推测蛋白质之
文档评论(0)