主講人:孙啸制作人:刘志华.pptVIP

  • 2
  • 0
  • 约 97页
  • 2017-04-22 发布于上海
  • 举报
主講人:孙啸制作人:刘志华

;第五章 DNA序列分析;第一节 DNA序列分析步骤和分析结果评价;发现重复元素;功能序列分析的准确性来自于对“功能序列”和“非功能序列”的辨别能力。 两个集合: 训练集(training set) 用于建立完成识别任务的数学模型。 测试集或控制集(control set) 用于检验所建模型的正确性。 用训练集中实例对预测模型进行训练,使之通过学习后具有正确处理和辨别能力。然后,用模型对测试集中的实例进行“功能”与“非功能”的判断,根据判断结果计算模识别的准确性。;收集已知的功能序列和非功能序列实例 (这些序列之间是非相关的 );Sn ——敏感性 Sp——特异性 Tp是正确识别的功能序列数, Tn为正确识别的非功能序列数, Fn是被错误识别为非功能序列的功能序列数, Fp是被错误识别为功能序列的非功能序列数。;敏感性和特异性的权衡;对于一个识别程序准确性可按下式进行综合评价: 另一个综合评介指标为相关系数,其计算计算公式为: ;选择训练集和测试集 在检测算法的可行性时,需要从已知的数据中按照不同的方式选择训练集和测试集 测试集的构成非常关键 在不同的测试集上进行测试可能会得到不同的准确性结果,甚至准确性相差很大。 建立标准的功能序列测试集合。 如基因转录剪切位点的测试集合、编码区域的测试集合等。 ;第二节 核苷酸关联分析;核苷酸 ;在统计过程中,如果同时计算DNA的正

文档评论(0)

1亿VIP精品文档

相关文档