chapter4DNA序列分析.ppt

chapter4DNA序列分析.ppt

第4章 DNA序列分析 DNA序列分析 ——基因序列 ——基因表达调控信息 寻找基因牵涉到两个方面的工作 : 识别与基因相关的特殊序列信号 预测基因的编码区域 结合两个方面的结果确定基因的位置和结构 基因表达调控信息隐藏在基因的上游区域,在组成上具有一定的特征,可以通过序列分析识别这些特征。 第1节 DNA序列分析步骤和分析结果评价 在DNA序列中,除了基因之外,还包含许多其它信息,这些信息大部分与核酸的结构特征相关联,通常决定了DNA与蛋白质或者DNA与RNA的相互作用。 存放这些信息的DNA片段称为功能位点 如启动子(Promoter)、基因终止序列(Terminator sequence)、剪切位点(Splice site)等。 功能序列分析的准确性来自于对“功能序列”和“非功能序列”的辨别能力。 两个集合: 训练集(training set) 用于建立完成识别任务的数学模型。 测试集或控制集(control set) 用于检验所建模型的正确性。 用训练集中实例对预测模型进行训练,使之通过学习后具有正确处理和辨别能力。然后,用模型对测试集中的实例进行“功能”与“非功能”的判断,根据判断结果计算模识别的准确性。 Sn ——敏感性 Sp——特异性 Tp是正确识别的功能序列数, Tn为正确识别的非功能序列数,

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档