- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
摘要
粗粒化和符号化,生物大分子(DNA、RNA、蛋白质等)也可表示
成一维符号序列的形式。通过对生物序列的LZ复杂性及其它相关特
性进行分析、比较,可以为解决近年来生物信息学领域许多基于序
列分析的重要问题提供新的计算方法和研究途径。
论文首先研究了LZ复杂性的概念和基本性质,在此基础上提出
符号序列最长后缀前缀(LSP)划分的概念,证明了LSP划分与LZ
复杂性定义中完备生成划分的等价性。提出了通过非空符号序列的
链接的后缀树构造算法作为主要的计算步骤,算法LSP.LZC总的计
算复杂度为线性时间和线性空间,在时间效率上优于现有的LZ复杂
性算法。
LZ复杂性是单个符号序列的数值属性。为了刻画不同序列间的
LZ复杂性关系,论文提出了条件LZ复杂性的概念。基于条件LZ
复杂性,进一步提出度量序列间相似关系的LZ复杂性相似度,证明
了LZ复杂性相似度满足相似性测度的正定、自反和对称等性质。论
文将LZ复杂性相似度应用于分子系统进化树重构的研究中。分别以
线粒体全基因组和病毒全基因组DNA序列作为计算数据,基于LZ
复杂性相似度对29种有胎盘哺乳动物和SARS冠状病毒进行系统进
化树的重构,都得到了具有合理生物学意义的结果。
基于LZ复杂性相似度,论文提出了相似度矩阵特征变换的概念
和LZ复杂性核及核矩阵的构造方法。证明了LZ复杂性核的正定性
和LZ相似关系不变性。给出了基于LZ复杂性核的支持向量机模型
在符号序列的模式分析中进行学习和预测的方法。利用上述方法,
可以实现基于一级序列数据的蛋白质亚细胞位点类型的机器预测。
在真实的分别由部分真核生物和原核生物组成的两个标准数据集上
进行预测实验,都取得了良好的效果。
论文还提出了基于蛋白质接触图间的LZ复杂性分析进行蛋白
质三维结构比较的方法。因为蛋白质的三维结构数据不能表示成符
号序列的形式,论文通过计算蛋白质三维结构的接触图,并计算蛋
白质对应接触图间的LZ复杂性相似度来度量不同结构之间的相似
性,间接实现蛋白质三维结构的比较。论文分别在由真实蛋白质结
库中构造的4个结构超家族数据集上对论文所提出的方法进行结构
比较的实验,都取得了理想的结果。
蛋白质
ABSTRACT
is oftheintrinsicalattributesof
one
Lempel—Ziv(LZ)complexity
coarse and
symbolicsequences.Throughappropriategraining
symbolization,biological be
asonedimensional an
symbol provides
represented sequences.It
altemative tosolve arisen
computationalapproach importantproblems
fromBioinformaticsrecent and LZ
yearsbyanalyzingcomparing
related of
andotherLZ characteristics
complexity complexity biological
sequences·
您可能关注的文档
- (Bi%2cCa)(Fe%2cTi)O3和Ca(Ti%2cMn)O3多铁性陶瓷结构及性能.pdf
- “开”认知多义网络构建之场景定位模式.pdf
- 《中国日报》和《卫报》报刊体育硬新闻体裁对比分析.pdf
- 2-甲基呋喃低层流燃烧火焰化学的研究.pdf
- 4SY-1.8型油菜割晒机输送系统研制.pdf
- 20世纪90年代后半叶纽约市硅巷发展.pdf
- CFRP粘结钢板复合构件剥离性能试验的研究.pdf
- Fe基合金结构和性能第一原理计算.pdf
- JCC客服代表团队管理的研究.pdf
- Ontology驱动异构数据源上关键字搜索.pdf
- 中国临床肿瘤学会(CSCO)浆液性癌性纤维瘤诊疗指南(2025年)解读.docx
- 财务模型和公司估值(205页 PPT).pptx
- 2025年AI伦理专员能力测试卷.docx
- 中国临床肿瘤学会(CSCO)癌前黑变病诊疗指南(2025年)解读.docx
- 中国临床肿瘤学会(CSCO)伴有软骨化生的腺癌诊疗指南(2025年)解读.docx
- 2025年AI教育数据分析专项卷.docx
- 中国临床肿瘤学会(CSCO)化生性癌诊疗指南(2025年)解读.docx
- 中国临床肿瘤学会(CSCO)转移性腺鳞癌诊疗指南(2025年)解读.docx
- 中国临床肿瘤学会(CSCO)伴有神经内分泌分化腺癌诊疗指南(2025年)解读.docx
- 中国临床肿瘤学会(CSCO)高分化胸腺癌诊疗指南(2025年)解读.docx
最近下载
- 中宁县大战场清真牛羊交易市场建设项目可行性研究报告.doc VIP
- 2025年10月自考行政管理学00277试题及解析.docx VIP
- 华东交通大学448汉语写作与百科知识2020年考研真题试题.pdf VIP
- 【MOOC】《过程控制》(南京邮电大学)章节期末中国大学慕课答案.docx VIP
- 崇尚科学反邪教小学手抄报Word模板可编辑可打印J.docx VIP
- 崇尚科学反邪教小学手抄报Word模板可编辑可打印A.docx VIP
- 河道保洁服务应急预案.doc VIP
- 第3单元微项目2 体验表格美化效果-泰山版(2018)第3册八年级信息技术上册教学设计.docx
- 风电项目风机吊装施工工期及施工进度计划方案.pdf VIP
- 第三讲 《易经》与风水(基础二).ppt VIP
原创力文档


文档评论(0)