- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
监督分类的基本的 原理及算法.ppt
式中,Na为资料A类的组数,Nb为资料B的组数。 费歇尔判别法 最大似然法(贝叶斯) 最大似然法 最大似然法 最大似然法 最大似然分类 最大似然法 神经网络识别 神经网络识别 精度评价 精度评价是对俩副图像进行比较,其中一幅是要进行评价的遥感分类图像,另一幅是假设精确的参考图。 误差矩阵与精度指标: 误差矩阵(也称混淆矩阵)用来表示精度评价的一种标准格式。误差矩阵是N行N列的矩阵,其中N代表列别的数量。 EMC EMC EMC Company Logo EMC Company Logo EMC Company Logo EMC Company Logo EMC Company Logo EMC Company Logo EMC Company Logo EMC Company Logo EMC Company Logo EMC Company Logo 监督分类的基本原理及算法 讲解者:彭彬 统计模式识别 统计模式识别是研究每一个模式的各种测量数据的统计特性,按照统计决策理论来进行分类。 图像 输入 训练 样本 输入 改进规则 预处理 特征处理 特征处理 分类 学习规则 误差 检验 预处理 识别 分析 模式识别的大致过程 图中的上半部分是识别部分,即对未知图像进行分类;下半部分是分析部分,即由已知判别的训练样本求出判别函数及判别规则,进而用来对未知类别的图像进行分类。右下脚部分是自适应处理(学习部分),当训练样本根据某些规则求出一些判别规则后,再对这些顺利样本逐个进行检验,观察是否有误差。这样不断的改进,直到满足要求为止。 从图中可以看出统计模式识别部分主要是特征处理和分类俩部分。 统计模式识别 特征处理:包括特征选择和特征变换 特征选择:指从原来的M个测量值集合中,按某一准则选择出一个N维(NM)的子集作为分类特征。要选取具有区分性,可靠性,独立性好的少量特征。(下面介绍俩种方法) 穷取法:从M个原始的测量值中选出N个特征,一共有C 种可能。对每一种选法用已知类别属性的样本进行试分类,测出其正确分类率,分类误差最小的一组特征是最好的选择。 最大最小类对距离法:首先在K个类别中选出最难分离的一对类别,然后选择不同的特征子集,计算这一对类别的可分性,具有最大可分性的特征子集就是该方法选择的最佳特征子集。 m n 特征处理 特征变换:是将原有的M个测量值集合通过某种变换,然后产生N(NM)个特征用于分类。 第一种情况:从减少特征之间的相关性和浓缩信息量的角度出发,根据原始数据的统计特性,用数学的处理方法使用尽量少的特征最大限度的包含所有原始数据的信息。主成分常用于这种。 第二种:根据对测量值所反映的物理现象和待分类类别之间关系的认识,通过数学运算产生一组新的特征,使得待分类别之间的差异在这组特征中更明显,有利于分类的结果。 监督分类:是根据预先已知类别名的样本,求出各类在特征空间的分布,然后利用它对未知函数进行分类的方法。 特征处理 距离函数 距离函数 距离函数 费歇尔判别法 费歇尔(Fisher)准则: 要使判别函数值能充分地区分开地理类型,就需要使各类均值之间的差别最大 (即使不同类之间的差别最大),而使各类内部的离差平方和为最小 (即使同类间的差别最小)。 换句话说,即要求类间(或组间)均值差与类内(或组内)方差之比最大 ,这样就能把地理类型区分得最清楚,这就是费歇尔准则的基本要点 。 图中:横坐标X1代表 变量x1,纵坐标代表变 量x2,其中俩个 区域分别表示A类 和B类总体的等概率 点的轨迹。如果只用X1 和X2来表示A和B类的的分布概率和密度,则很难将俩个数据分清楚,因为A和B类的数据在俩个坐标轴上都有较大的部分重叠。 A B A B X1 X2 A B A B Y2 Y1 C 费歇尔判别法 只有将俩类的数据投影到 直线Y1上,俩类重叠部分 显著减少,直线Y上所代 表的俩个变量的现象组合 ,即可看做是线性判别函 数。C点可以看做是俩个 样本的判临界值,将一维 空间划分成俩个空间C可 以看做是A类和B类的判 别指标。 A B A B X1 X2 A B A B Y2 Y1 C 费歇尔判别法 只有将俩类的数据投影到 直线Y1上,俩类重叠部分 显著减少,直线Y上所代 表的俩个变量的现象组合 ,即可看做是线性判别函 数。C点可以看做是俩个 样本的判临界值,将一维 空间划分成俩个空间C可 以看做是A类和B类的判 别指标。 依费歇准则的要求,就要根据已知的地理特征值进行线性组合,构成一个线性判断函数y即: y=c1*x1+c2*x2+…+cm*xm 其中, c1,c2,…, cm 为待求的判别函数系数,它可反映各要素或特征值的作用方向、分辨能力和贡献率的大小。 只要确定了ck(k=1,2,3…),判别函数
文档评论(0)