2014判别析法
统计与应用数学学院;目
录; 判别分析也称为模式识别,用于解决已知若干总体类别,对未知样本的识别问题。比如:已知正常人与癌症患者两类总体,如何依据检验指标判别某人是否患有癌症?;图1.线性判别示意图;1. MATLAB线性判别命令;例1.现测得6只Apf和9只Af蠓虫的触长,翅长数据
Apf:(1.14,1.78), (1.18,1.96), (1.20,1.86), (1.26,2.00), (1.28,2.00), (1.30,1.96)
Af:(1.24,1.72), (1.36,1.74), (1.38,1.64), (1.38,1.82), (1.38,1.90), (1.40,1.70), (1.48,1.82),(1.54,1.82), (1.56,2.08)试判别以下的三个蠓虫属于哪一类?
(1.24,1.8),(1.28,1.84),(1.4,2.04);class1 = classify(sample,training,group, linear);2. K近邻判别;3.支持向量机;(2)svmclassify的格式为:
class = svmclassify(svmStruct,sample, varargin),
其中返回变量outclass是利用分类器对测试样本分类的结果,输入变量svmStruct为由svmtrain函数得到的分类器,sample为测试样本集,varargin同上。;其中:带o的样本就是支持向量;分类结果如下:
classes =
-1
-1
1;二;(2) 一个向量到一个总体的马氏距离;(3) 两个总体之间的马氏距离;2. 两个总体的马氏距离判别;判别步骤:;上述公式可以化简为:;例1.现测得6只Apf和9只Af蠓虫的触长,翅长数据
Apf:(1.14,1.78), (1.18,1.96), (1.20,1.86), (1.26,2.00), (1.28,2.00), (1.30,1.96)
Af:(1.24,1.72), (1.36,1.74), (1.38,1.64), (1.38,1.82), (1.38,1.90), (1.40,1.70), (1.48,1.82),(1.54,1.82), (1.56,2.08);解:;在MATLAB中mahal 计算马氏距离平方;例2.对例1若两总体协方差矩阵不等,试判别; 从例1和例2,发现两个总体的协方差矩阵是否相等,得到的结论可能不同,因此在解决实际问题时,首先要判别两个总体的协方差矩阵是否相等?;对于例1,应用检验程序如下:;贝叶斯(Bayes)判别;两个正态总体的Bayes判别;例3. 用贝叶斯判别蠓虫的步骤;解:;由于d =
1.7585
0.9514
1.5747
全部大于零,即p1f1p2f2;三;判别分析的误差估计;(2)交叉误判率估计
交叉误判率估计是每次剔除一个样品,利用其余的m+n-1个训练样本建立判别准则再用所建立的准则对删除的样品进行判别。对训练样本中每个样品都做如上分析,以其误判的比例作为误判率。;于是交叉误判率估计为: ;平均误判概率的计算公式;作业:对于蠓虫判别分别计算回代误判、交叉误判以及平均误判概率.;1. 读取每个碱基对所占的百分比;Bases =
A: 33
C: 19
G: 44
T: 15;2000年(A题)
作为研究DNA序列的结构的尝试,提出以下对序列集合进行分类的问题。
下面有20个已知类别的人工制造的序列,其中序列标号1~10为A类,11~20为B类。请从中提取特征,构造分类方法,并用这些已知类别的序列衡量你的方法是否足够好。然后用你认为满意的方法,对另外20个未标明类别的人工序列(标号21~40)进行分类,把结果用序号(按从小到大的顺序)标明它们的类别(无法分类的不写入)。;判别分析建模的基本步骤:;判别分析建模方法可以解决的实际问题;3. 艾滋病疗效分析;模型评价分析的有关问题 ;4. 数值分析建模必须研究算法的优缺点,以及误差的估计分析.;谢 谢!
THANK YOU!
原创力文档

文档评论(0)