- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* 八十年代末期,林华安博士认识到将计算机科学与生物学结合起来的重要意义,开始留意要为这一领域构思一个合适的名称。起初,考虑到与将要支持他主办一系列生物信息学会议的佛罗里达州立大学超型计算机计算研究所的关系,他使用的是“CompBio”;之后,又将其更改为兼具法国风情的“bioinformatique”,看起来似乎有些古怪。因此不久,他便进一步把它更改为“bio-informatics(或bio/informatics)”。但由于当时的电子邮件系统与今日不同,该名称中的-或/符号经常会引起许多系统问题,于是林博士将其去除,今天我们所看到的“bioinformatics”就正式诞生了,林博士也因此赢得了“生物信息学之父”的美誉。 林华安 * 基因识别,是生物信息学的一个重要分支,使用生物学实验或计算机等手段识别DNA序列上的具有生物学特征的片段。 根据进化树不仅可以研究从单细胞有机体到多细胞有机体的生物进化过程,而且可以粗略估计现存的各类种属生物的分歧时间。 生物芯片技术是通过缩微技术,根据分子间特异性地相互作用的原理,将生命科学领域中不连续的分析过程集成于硅芯片或玻璃芯片表面的微型生物化学分析系统,以实现对细胞、蛋白质、基因及其它生物组分的准确、快速、大信息量的检测。 基因表达是指细胞在生命过程中,把储存在DNA序列中的遗传信息经过转录和翻译,转变成具有生物活性的蛋白质分子的过程. 基因组学研究生物基因组和如何利用基因的一门学问。 利用生物分子的结构信息参与创新药物的设计为创新药物设计提供筛选和设计模型, * 破解大自然的奥妙并不是只需要聪明的脑瓜和经过严格的科学训练,还需要灵活通达的想法、百折不挠的韧性以及相当的运气。 1953年4月25日,英国《自然》杂志登载了沃森和克里克的论文《核酸的分子结构——脱氧核糖核酸的一个结构模型》 * 一级结构:以各种氨基酸按一定的顺序排列构成的蛋白质肽链骨架为蛋白质的一级结构 * 从20个物种的一元组图中可以看出,亮氨基(L)在每个物种中的使用频度都很高,其秩出现在前三位中;而色氨酸(W) 和半胱氨酸(C)在每个物种中的使用频度都很低,其秩出现在后三位中。在人类语言中,一些高频词不会影响句子的意义,相反,往往一些低频词却可以对句子的意义起决定性作用,因此,一些使用频度低的氨基酸也许会对蛋白质的结构和功能产生重要的影响。 人的一元组 * 另一个统计特性是,在蛋白质序列中存在与特定物种有关的“短语”。如图褐家鼠的四元组HTGE,GEKP,CGKA,GKAF,IHTG,PYKC的使用频度都比较高,而在其他的物种中使用频度却较低。 褐家鼠的四元组 * 假定数据集中含有从大到小排列的n个数xi:x1 x2 … xr … xn, α的值大约在0.5左右 在对数-对数曲线中,秩r和其值xr之间呈线性关系。 人们发现各种不同的“语言”包括汉语、英语等,其词频和秩之间均符合Zipf定律,尤其是英语,在语素级、单词级、词性级、语句级、二元对、三元对等各个语言层次都近似的遵循各自不同形式的Zipf定律。 * 利用N-gram的统计结果把指定的N-gram按出现频率从大到小排列,并绘出频率和秩之间的对数关系,该图给出了物种Human 对数形式的Zipf曲线。从图中可看出,当N4时,N-gram频率和秩之间近似符合Zipf定律,α的值大约在0.5左右。 * 生物序列到其结构和功能的映射关系和语言中词到语义的映射关系类似。在语言学中,由字词可以排列成有意义的句子;而在生物学中,氨基酸排列代表蛋白质的结构和功能,可以把这些氨基酸看成有意义的语音或者词,从而分析蛋白质的结构和功能,其相似性如图1-1所示。文档中的词直接映射到语义,并且包含文章主题的相关信息;同理,蛋白质序列可看成是原始的文本,包含关于结构和功能的相关信息,利用这些信息可进一步理解蛋白质之间的相互作用。 * * 蛋白质相互作用位点预测是给定没有结合其他蛋白质的蛋白质结构或者序 列,并且已知该蛋白质和其他未知蛋白质存在相互作用,预测该蛋白质链上那 些残基位于相互作用的分界面上,如图,左侧蛋白质用红色表示是相互作用位点的残基。 * 近十年来,数个诺贝尔生理学奖与蛋白质相互作用研究有关,比如1992年 的Edmond H. Fischer 和Edwin G. Krebs , 1994年的Alfred Gilman和Martin Rodbell,1999年的Günter Blobel,2000年的Paul Greengard等。 * 从图中我们可以看出,支持向量机预测错误的位点大多位于接口的外部,如图5-6B中的圆圈中标识的残基,它们和实际的相互作用位点相距甚远。在这个蛋白质上,条件随机域方法可以成功地区分接口残基和非接口残基。 *
您可能关注的文档
最近下载
- 【地理】河流与湖泊 课件-2025-2026学年地理人教版(2024)八年级上册.pptx VIP
- 2.1《职场应用写作与交流(一)求职和应聘》优秀获奖课件.pptx VIP
- 高中历史教学中人工智能协作学习评价与反馈体系构建教学研究课题报告.docx
- 电力系统微机继电保护教学课件电子教案全套课件.pptx VIP
- 2022年船载危险货物申报员和集装箱检查员从业资格考核全国统考试题.pdf VIP
- 石油小知识.ppt VIP
- 托福词汇词以类记-张红岩(完整有目录).pdf VIP
- 中考英语篇完型填空练习(附答案).pdf VIP
- 水浒传-林冲(共47张课件).pptx VIP
- 乡村医生考试题库及答案完整版.doc VIP
文档评论(0)