湖南大学计算机与通信学院嵌入式系统与网络实验室.pptVIP

  • 30
  • 0
  • 约5.09千字
  • 约 26页
  • 2018-02-14 发布于江西
  • 举报

湖南大学计算机与通信学院嵌入式系统与网络实验室.ppt

湖南大学计算机与通信学院嵌入式系统与网络实验室

* * 07级硕士研究生毕业答辩报告 * * 湖南大学计算机与通信学院嵌入式系统与网络实验室 答 辩 人:梁成 指导老师:李仁发教授 骆嘉伟教授 RNA二级结构相似性分析研究 07级硕士研究生毕业答辩报告 * * 大纲 研究背景与意义 主要研究工作 提出一种新的RNA二级结构3D表示法,对12种常见的RNA二级结构及11种真实的RNA二级结构进行了相似性分析,并采用层次聚类算法构建了进化树 提出一种新的RNA二级结构特征序列表示方法,利用LZ复杂度验证该表示法的可行性 工作总结 RNA二级结构相似性分析研究 * * 研究背景及意义 RNA二级结构相似性分析研究 生物信息学的飞速发展 给计算机科学带来的挑战和机遇 对基因序列的分析和处理 分析RNA二级结构的意义 RNA二级结构对其功能的影响 RNA二级结构具有更大的保守性 * * 研究背景和意义 RNA二级结构相似性分析研究 基因数据的海量增长 对序列信息的提取 传统的序列比对方法 图形化表示的需要 * * RNA二级结构的相似性分析方法 传统的基于字符串表示的序列比对算法 打分函数的定义,空位罚分缺乏理论依据 计算复杂度较高 图形化的表示方法 将二级结构转换为线性的特征序列 给出特征序列对应的图形 基于Lempel-Ziv算法的分析方法 以序列的LZ复杂度作为度量的指标 RNA二级结构相似性分析研究 * 用 来表示配对基中的A,U,G,C 可得到特征序列表示为: * RNA二级结构的特征序列 * * 一种新的RNA二级结构的3D表示法 RNA二级结构相似性分析研究 考虑碱基的三种分类,给出其3D表达式 其中 * * RNA二级结构相似性分析研究 该表示法具有的性质 性质1:绕坐标轴旋转 得到的碱基间的旋转变换关系 性质2:序列的反射对称性 * * 相似性分析算法 距离矩阵D是一个对角线为0的非负实对称矩阵,反映了物种间的两两关系。dij越小,两条序列的相似性程度越高,反之则相似性越低 RNA二级结构相似性分析研究 算法的时间复杂度为O(N*num) 相似性距离度量公式: * * 实验数据(一) RNA二级结构相似性分析研究 * * 实验数据(二) RNA二级结构相似性分析研究 No Accession Length Year Secondary Structure Name Kind 1 AE000965 1493 2001 Archaeoglobus fulgidus 16S.a 2 AE004437 1474 2001 Halobacterium sp. 16S.a 3 K00637 1553 2000 Bacillus subtilis 16S.b 4 J01695 1542 2001 Escherichia coli 16S.b 5 M21086 130 2007 Pyrodictium occultum 5S.a 6 X05870 127 2007 Sulfolobus sp. 5S.a 7 X05233 120 2007 Actinia equina 5S.e 8 K02348 120 2007 Chrysaora quinquecirrha 5S.e 9 X01550 120 2007 Planocera reticulata 5S.e 10 L12747 369 Saccharomyces diastaticus RNase 11 L12749 336 Saccharomyces kluveri RNase * * PKB240和PKB4的坐标映射图 RNA二级结构相似性分析研究 PKB240在XOZ面上的坐标映射图 PKB4在XOZ面上的坐标映射图 碱基的总量分布: 观察z坐标的值,从第一个碱基开始到任一位置处,配对基的数量要多于自由基 观察x坐标的值,从第一个碱基开始到任一位置处,嘌呤的含量要多于嘧啶 * * 实验结果分析 RNA二级结构相似性分析研究 非含假结数据(CVV-3,EMV-3),(CiLRV-3,LRMV-3),(AVII,EMV-3),(AVII,LRMV-3),(EMV-3,LRMV-3) 含假结数据(PKB4,PKB240) Species AIMV-3 APMV-3 AVII-3 CiLRV-3 CVV-3 EMV-3 LRMV-3 PDV-3 PKB223 PKB240 PKB4 TSV-3 AIMV-3 0 0.0538 0.0651 0.0432

文档评论(0)

1亿VIP精品文档

相关文档