- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
摘要摘要
摘要
摘要
细胞因子(Cytokine)是机体的免疫细胞和非免疫细胞合成并分泌的小分子 量的多肽类因子,能调节多种细胞生理功能,在生长发育、机体免疫等过程中 起着非常重要的调控作用。从第一个细胞因子被发现以来,细胞因子相关的研 究一直是国际免疫学研究的热点问题。细胞因子的研究有助于阐明分子水平的 免疫调节机制,有助于疾病的预防、诊断和治疗,利用细胞因子治疗肿瘤、感 染、造血功能障碍以及自身免疫病等已有了初步成效。因此,新型细胞因子的 发掘与研究具有深远而广泛的理论意义和实际应用价值。随着生物信息学的迅 速发展,细胞因子的研究不再单纯依靠实验手段。到1990年代末期,新型细胞 因子的发掘越来越多地借助于生物信息学工具的指导。以白介素(Interleukin,IL) 为例,从2000年至今,至少有ILl9-1L32等十几种新型白介素得以发现。在此
过程中,生物信息学的序列分析和数据库搜索等手段发挥了重要作用。但是, 一方面,已有研究中的大部分方法依赖于一些机构自主丌发的商业化的数据库, 普通研究者无法获得使用机会,限制了细胞因子发掘工作的长足发展:另一方 面,已有研究中的生物信息学方法往往只是简单应用,缺乏对细胞因子相关数 据的系统而深入地挖掘。
利用生物信息学手段进行新型细胞因子发掘工作的主要瓶颈问题在于,细 胞因子家族进化速率高,家族成员序列保守性低(相似程度一般在30%左右), 因此采用传统方法通过BLAST工具搜索数据库难以发现数据库中蛋白质家族 的远同源关系的新成员。然而,细胞因子家族在保持结构和功能的相似时,在 较长序列上仍然会保留少数相似位点的痕迹。基于此,本文提出一个细胞因子 发掘的生物信息学策略,通过模体(Moti0识别刻画细胞因子家族的特征来发掘
新型细胞因子。
本文首先比较分析了当前常用的几种模体识别方法。重点阐述了MEME、 GreedyEM、HMM和PSTs等四种模体识别方法的特点,发现MEME和HMM 方法更具优势。于是,文中提出一种新的模体评价策略来定量分析这两种方法 的优劣。把模体看作分类器(Classifier),模体对数据集的搜索看作分类器对数据 集中序列的分类。选择了PROSITE数据库中的七个细胞因子家族作为七个数据 集,分别采用MEME和HMM方法对每个训练集进行模体识别。通过计算每个
北京工业大学工学博士学位论文数据集上模体的敏感性和特异性以及比较它们对应的接收机操作特性曲线
北京工业大学工学博士学位论文
数据集上模体的敏感性和特异性以及比较它们对应的接收机操作特性曲线 (Receiver Operating Characteristic Curves),比较了不同模体的优劣。最终发现 MEME和HMM任何一种方法都没有绝对的优势。因此必须根据对训练集的具 体分析选择不同的模体识别方法。
其次,模体识别效果的好坏,既取决于模体识别方法的选择,也取决于蛋 白质家族训练集的选择。根据是否具有直接或问接参与机体的造血调控功能, 本文选择了造血细胞因子家族为一个训练集;通过结合文献和已知三级结构的
细胞因子的分类,文中将细胞因子家族按照结构分类做了补充和完善,并根据
结构分类选择短链和长链4a螺旋家族为两个结构训练集:另外还选择了功能和 结构均保守的ILl0家族作为训练集。为了观察细胞因子家族的保守位点和家族 成员之间的亲缘关系,对四个训练集的蛋白质序列分别进行了多重比对和进化 树分析。由于MEME方法对这四个家族的搜库结果假阳性过高,本文选择HMM 方法对四个细胞因子家族构建HMM模体。根据不同训练集的特点,对造血细 胞因子家族的两个训练集建立了六个HMM,对其他三个家族的细胞因子分别 建立一个HMM。每个模体对三个蛋白质序列数据库:全物种的SWISS—PROT 数据库、人源的IPI数据库和人源的Nr数据库进行搜索,识别每个数据库中与 模体匹配的蛋白质,并去除冗余,获得待筛选的候选蛋白质。
最后,在数据库搜索的结果中筛选和预测可能的细胞因子是比较艰难的工 作,并没有现成的标准可供直接利用。从计算的角度出发,判断搜库结果的好 坏主要看搜库获得的蛋白质与已知模体匹配的得分和统计的E值。得分越高, E值越低,模体与蛋白质序列匹配的越好。也就是说,两者的匹配缘于偶然的 可能性越小。同时,训练集家族的固有的生物学特征是判断搜库获得的蛋白质
(目标蛋白质,Subjectprotein)是否与建模家族有关的重要依据。目标蛋白质 与建模家族细胞因子具有相同或相近的生化特征越多,目标蛋白质就越可能是 新型细胞因子。细胞因子的特点是低分子量分泌型蛋白,分子量大多在15kD 到30kD之间。虽然序列相似性很低,但是同一家族细胞因子成员在二级结构 上比较相近,并且部分细胞因子的染色体定位聚于一簇,细胞因子的
您可能关注的文档
- 蓝白电泳粒子的改性及其在电泳显示中的应用-应用化学专业论文.docx
- 论张君劢社会主义思想及其现代意义-马克思主义中国化研究专业论文.docx
- 垃圾土的工程性质分析-岩土工程专业论文.docx
- 淋巴细胞基因表达谱揭示淫羊藿总黄酮重建衰老免疫稳态的分子机制-中西医结合临床专业论文.docx
- 辽河录井技术长庆市场推广应用案例-项目管理专业论文.docx
- 论“伊玛堪”的史料价值-史学理论及史学史专业论文.docx
- 辽南公司物资采购管理系统的设计与实现-软件工程专业论文.docx
- 跨地区经营建筑企业所得税汇总纳税管理研究-公共管理专业论文.docx
- 硫辛酸胺在实验性蛛网膜下腔出血早期脑损伤中的神经保护作用及相关机制的实验分析-神经外科专业论文.docx
- 宽带无线多媒体系统MAC层多播广播技术的研究-通信与信息系统专业论文.docx
最近下载
- 毛中特题库及答案.doc VIP
- TIA-942数据中心电信基础设施标准(中文版).pptx VIP
- 智能经济+人工智能与制造融合可行性研究.docx VIP
- 人教版小学五年级上册数学第一单元.ppt VIP
- 人教版小学科学《建筑中的结构(一)》教学课件.pptx VIP
- dram技术发展史年表.pdf VIP
- 2025年广西专业技术人员继续教育公需科目考试题库及答案(可考95分以上).docx
- 精品解析:天津市双菱中学2024-2025学年七年级上学期期末考试英语试题(解析版).docx VIP
- 第二单元《银屏乐声》第3课时《人世间》+《永志不忘》课件 人音版八年级音乐上册.pptx VIP
- T_CITS 359—2025(医学实验室分子诊断质控品选择和使用指南).pdf VIP
原创力文档


文档评论(0)