模式识别及其分类.pptx

  1. 1、本文档共40页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
模式识别与分类本章作业导言数据预处理无监督方法 一次观察的矢量表示n为空间维数,变量数变量即特征各特征类型/量纲/大小相差大模式识别与分类导言 Clustering/Classification 统称 如下问题 人眼识别物 中医看舌苔/脉搏 图谱辨别化合物 低维与高维数据均值0方差1模长模式识别与分类数据预处理 值域调整range scaling 自标度化 Autoscaling模长为1色谱面积归1模式识别与分类数据预处理 标准化 Normalization质谱最大为1模式识别与分类数据预处理 变换法 组合法原变量相加/减/除等偏差权重法s大的变量更重要Fisher比率法F大的变量更重要模式识别与分类数据预处理 特征的选择对于n为对象数,p为特征数方差j=1,…,p 协方差j,k=1,…,p;j≠k 模式识别与分类数据预处理协方差矩阵C与相关矩阵R模式识别与分类数据预处理方差-协方差矩阵,简称协方差矩阵如下:对称矩阵其中模式识别与分类数据预处理相关矩阵如下:但对于Autoscaling后的数据,s=1。C即为R。主成分分析PCA因子分析FA聚类分析clustering模式识别与分类无监督方法模式识别与分类PCA得分score载荷loading d为主成分数 模式识别与分类PCA投影判别法 数据重构组成互不相关的新变量 取较少的主成分数(常为2),完成分类 不同嫌疑人头发中元素的含量(μg/g) 样品 Cu Mn Cl Br I1 9.2 0.30 1730 12.0 3.6 2 12.4 0.39 930 50.0 2.3 3 7.2 0.32 2750 65.3 3.4 4 10.2 0.36 1500 3.4 5.3 5 10.1 0.50 1040 39.2 1.9 6 6.5 0.20 2490 90.0 4.6 7 5.6 0.29 2940 88.0 5.6 8 11.8 0.42 867 43.1 1.5 9 8.5 0.25 1620 5.2 6.2 计算相关矩阵计算特征值autoscaling模式识别与分类PCA实例1返回原始数据X(9×5) 头发样品中的特征值与方差 成分数 特征值λ 方差% 累计方差% 1 3.352 67.05 67.05 2 1.182 23.6590.70 3 0.285 5.70 96.40 4 0.135 2.70 99.10 5 0.045 0.90 100.00对于相关矩阵, λ1的成分为主成分指定 ,如90% 相应的d模式识别与分类主成分数的确定PCA实例1方差百分数特征值1Scree检验nPC在2-3间斜率下降 因此d=2合适模式识别与分类PCA实例1主成分图形解释得分图t1对t2作图3个聚类分属三人t1最重要模式识别与分类PCA实例1主成分图形解释载荷图l1对l2作图特征在主成分上的投影各变量的相关信息夹角越小,相关性越高高度相关的特征取1即可载荷大小是重要性的度量位于原点的载荷不重要金属间的相关性大于卤素间的Cu与Cl反性相关l1最重要,距原点距离越大,该特征权重越大,Cu相似系数相关系数1:完全相同0:完全正交Cu/Cl负相关自标度化的数据cosα=rBr/I接近正交模式识别与分类PCA实例1主成分图形解释 相似系数或相关系数表 CuCu 1.000 MnMn 0.697 1.000 Cl Cl -0.950 -0.692 1.000 Br Br -0.530-0.233 0.588 1.000 I -0.645 -0.749 0.581-0.084 模式识别与分类PCA实例1主成分图形解释得分图特征的选择5个全取取Cu/Br/I仍能分类效果略差取Cu/Mn/Cl分类效果差l2无效果3个λ,仅1个12.57,0.38,0.05一维投影结果原始数据模式识别与分类PCA实例1主成分图形解释双重图biplott1各元素均有贡献t2由Br和I表征Cu/Mn/Cl/I将对象聚为2组Br将对象聚为另2组下部上部中部模式识别与分类PCA实例1应用示例烟叶硅烷化色谱 辽宁凤城烟叶不同部位烟叶的区分模式识别与分类FA 用少数几个通用因子描述矩阵中的特征 抽象因子需经旋转变换成实因子TTFA包含d个因子的特征参数,各因子对应1个起因与对应因子相关的载荷分数由剩余p-d个和通用因子无关的特殊因子构成,如噪声因子模式识别与分类FA目标转换因子分析Target Transformation FA变换矩阵抽象载

您可能关注的文档

文档评论(0)

helen886 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档