- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
质和原核生物真核生物蛋白质的亚细胞定位预测研究-2
附件2
论文中英文摘要格式
作者姓名: 陈颖丽
论文题目: 细胞凋亡蛋白质和原核生物、真核生物蛋白质的亚细胞定位预测研究
作者简介: 陈颖丽,女,1974年8月出生,2002年9月师从于内蒙古大学李前忠教授,于2007年7月获博士学位。
中 文 摘 要
随着人类基因组计划的顺利实施,越来越多的蛋白质序列被测定出来,而对蛋白质结构和功能的认识却远落后于序列的测定。由于蛋白质所处亚细胞的位置与其在细胞中行使的功能密切相关,因此,研究蛋白质的亚细胞定位是研究蛋白质功能的一个重要的手段。由于通过实验手段确定蛋白质的亚细胞定位既耗时,成本又高,且实验中可能还会遇到一些目前无法解决的困难,因此探索利用理论及计算的方法来得到蛋白质亚细胞定位的信息就变得越来越重要,这一工作已成为当前研究的热点。
本文从功能分类和生物分类的两种角度,研究了细胞凋亡蛋白质和原核生物、真核生物蛋白质的亚细胞定位预测问题,原核生物中重点以革兰氏阴性菌蛋白质为研究对象。论文的主要研究结果如下:
1. 在最小离散增量预测算法(ID)的基础上,提出两种新的组合预测算法-离散增量融合算法(IDF)和离散增量结合支持向量机算法(ID_SVM),并首次应用到细胞凋亡蛋白质的亚细胞定位预测上,针对已有的两个细胞凋亡蛋白质测试数据集与SVM算法的结果进行了分析比较,结果显示,我们的算法可以实现比以往方法更高的预测成功率。
2. 鉴于目前存在的细胞凋亡蛋白质数据集所包含的序列数和亚细胞类别都较少的情况,我们构建了一个新的数据集,扩大了细胞凋亡蛋白质的序列数和亚细胞类别。分别采用IDF、SVM和ID_SVM三种算法进行了亚细胞定位预测,均取得了较好的预测效果。
3. 提出一种新的蛋白质序列特征提取方法-氨基酸序列的亲疏水性分布特征提取法,并与N端信号肽序列的二肽组分特征、C端序列的二肽组分特征整合起来形成Hybrid特征提取法,结合IDF、SVM和ID_SVM三种算法构成不同的预测系统,对细胞凋亡蛋白质的亚细胞定位进行预测研究。结果表明,整合了三种信息的Hybrid特征提取法其预测能力均好于单特征提取法,Jackknife检验下其总体预测成功率比氨基酸组成成分特征提取法最大可提高35.7%。
4. 首次将ID算法和IDF算法应用到革兰氏阴性菌的蛋白质亚细胞定位预测中,针对目前研究者普遍使用的两个数据集(Gram_Data1和Gram_Data2)进行了研究。从数据集的蛋白质序列中构建了多种特征参数集,分析了单特征集和多特征组合模式对预测结果的影响,结果表明,间隔氨基酸残基对组成、N端序列的二肽组分和氨基酸序列的组成分布三种特征整合后能够有效地提高革兰氏阴性菌蛋白质亚细胞定位的预测成功率,Jackknife检验下其总体预测成功率比氨基酸组成成分特征提取法可提高11.1%。
5. 将ID算法和IDF算法首次应用到原核生物和真核生物的蛋白质亚细胞定位数据集中,基于氨基酸序列的亲疏水分布、氨基酸组分和二肽组分特征提取法,讨论了单特征提取方法和多特征组合提取方法对原核生物和真核生物蛋白质亚细胞定位的影响。以原核生物的蛋白质数据集为例,与其它算法进行了比较,发现我们的算法在预测Extracellular类蛋白时能给出更好的预测效果。
6. 文中还对不同数据集蛋白质N端序列截取残基长度、氨基酸序列的亲疏水分布的分段数目P和氨基酸组成分布的分段数目P的选取进行了初步探讨亚细胞定位;细胞凋亡;离散增量支持向量机特征提取亲疏水分布革兰氏阴性菌A Study on the Prediction of the Subcellular Location of Apoptosis Proteins, Prokaryotic and Eukaryotic Proteins
Chen Yingli
ABSTRACT
With the success of human genome project, a widening gap appears between rapidly increasing known protein sequences and slow accumulation of known protein structures and functions. The knowledge of the subcellular location of a protein is important to understand its function. Determination of protein subcellular location purely using experimental approaches is time-consuming and expensive. Thus,
您可能关注的文档
- 财税法知识点整理.doc
- 财管公式总结大全最新2014.docx
- 财管计算分析题集.doc
- 财经基础知识.doc
- 财经法规与会计职业道德历年真题.doc
- 财经法规与会计职业道德知识重点整理.doc
- 财经法规与会计职业道德试题库及答案.doc
- 财经法规复习知识点.doc
- 财经法规案例分析.doc
- 财经法规案例分析题14131.doc
- 2025-2030中国石油化工设备行业发展分析及市场竞争格局与发展前景预测研究报告.docx
- 2024年湖南铁道职业技术学院单招职业技能考试题库附答案.docx
- 2025-2030中国石油烃树脂行业市场发展趋势与前景展望战略研究报告.docx
- 2025-2030中国石油天然气检测行业市场发展分析及前景趋势与投资研究报告.docx
- 2025-2030中国石油钻井测斜仪投资规模与未来经营效益研究报告.docx
- 2025-2030中国石油化工催化剂行业市场发展趋势与前景展望战略分析研究报告.docx
- 2025-2030中国石油和天然气消防系统行业市场现状供需分析及投资评估规划分析研究报告.docx
- 专题18 《富贵不能淫》 (最新模拟)(解析版)-备战2024年中考语文·课内39篇文言文阅读.docx
- 专题18 《富贵不能淫》 (过关检测)(解析版)-备战2024年中考语文·课内39篇文言文阅读.docx
- 专题27 《虽有嘉肴》 (过关检测)(解析版)-备战2024年中考语文·课内39篇文言文阅读.docx
最近下载
- ECMO联合CRRT技术_精选完整版.pptx
- 劳保采购合同范本 .pdf VIP
- GB_T 43697-2024 数据安全技术 数据分类分级规则.docx
- 22J403-1 楼梯 栏杆 栏板一 (1).docx VIP
- 毕业设计(论文)-土豆筛选机设计.docx
- 冀教版一年级下册美术第6课《灵巧的手》教学课件.pptx VIP
- 2025年郑州黄河护理职业学院单招职业技能测试题库及答案(历年真题).docx
- 【历史】辽宋夏金元时期经济的繁荣课件 2024-2025学年七年级历史下册.pptx VIP
- 中齿培训:赢在接诊.pptx VIP
- DB31∕T 1135-2019 健康旅游服务基地建设运营管理规范.docx VIP
文档评论(0)