- 1、本文档共39页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
模式识别与分类 模式识别与分类 模式识别与分类 模式识别与分类 模式识别与分类 模式识别与分类 模式识别与分类 模式识别与分类 模式识别与分类 模式识别与分类 模式识别与分类 模式识别与分类 模式识别与分类 模式识别与分类 模式识别与分类 模式识别与分类 模式识别与分类 模式识别与分类 模式识别与分类 模式识别与分类 模式识别与分类 模式识别与分类 模式识别与分类 模式识别与分类 模式识别与分类 模式识别与分类 模式识别与分类 模式识别与分类 模式识别与分类 模式识别与分类 模式识别与分类 模式识别与分类 模式识别与分类 模式识别与分类 模式识别与分类 模式识别与分类 模式识别与分类 模式识别与分类 作业1 重现TTFA法对PAH的HPLC-DAD数据进行 是否存在的判断。 聚类分析 A、B聚后新距离的算法 加权均连weighted average linkage 单连法(最近距离)single linkage 全连法(最远距离)complete linkage 其他方法 线性学习机LLM K最近邻法KFA SIMCA法 有监督方法 LLM 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 判别面 以分2类(疾病判断)为例 存在一判别面,用垂直的法线(权)矢量w表示 与类1中任一样本矢量的夹角 ,与类2中 线性判别函数s(标量) ,s0 ,s0 LLM 步骤 已知样本作训练得法线矢量w 未知样本计算s并预测分类 初值w,可随机确定 第1个已知样本 计算s 不符 下一个样本计算s 继续调整w LLM实例 数据 初值 LLM实例 修正w 不修正 须修正 以后还需修正1次,最终 判别 * 导言 数据预处理 无监督方法 有监督方法 本章作业 导言 Clustering/Classification 统称 如下问题 人眼识别物 中医看舌苔/脉搏 图谱辨别化合物 低维与高维数据 一次观察的矢量表示 n为空间维数,变量数变量即特征各特征类型/量纲/大小相差大 数据预处理 值域调整range scaling 自标度化 Autoscaling 均值0方差1模长 数据预处理 标准化 Normalization 模长为1 色谱面积归1 质谱最大为1 数据预处理 变换法 原变量相加/减/除等 组合法 数据预处理 特征的选择 偏差权重法 s大的变量更重要 Fisher比率法 F大的变量更重要 数据预处理 协方差矩阵C与相关矩阵R 对于 n为对象数,p为特征数 方差j=1,…,p 协方差j,k=1,…,p;j≠k 数据预处理 方差-协方差矩阵,简称协方差矩阵如下: 对称矩阵 数据预处理 相关矩阵如下: 其中 但对于Autoscaling后的数据,s=1。C即为R。 主成分分析PCA 因子分析FA 聚类分析clustering 无监督方法 PCA 得分score载荷loading d为主成分数 PCA 投影判别法 数据重构组成互不相关的新变量 取较少的主成分数(常为2),完成分类 PCA实例1 不同嫌疑人头发中元素的含量(μg/g) 样品 Cu Mn Cl Br I 1 9.2 0.30 1730 12.0 3.6 2 12.4 0.39 930 50.0 2.3 3 7.2 0.32 2750 65.3 3.4 4 10.2 0.36 1500 3.4 5.3 5 10.1 0.50 1040 39.2 1.9 6 6.5 0.20 2490 90.0 4.6 7 5.6 0.29 2940 88.0 5.6 8 11.8 0.42 867 43.1 1.5 9 8.5 0.25 1620 5.2 6.2 原始数据X(9×5) autoscaling 计算 相关矩阵 计算 特征值 返回 方差百分数 主成分数的确定 指定 ,如90% 相应的d PCA实例1 头发样品中的特征值与方差 成分数 特征值λ 方差% 累计方差% 1 3.352 67.05 67.05 2 1.182 23.65 90.70 3 0.285 5.70 96.40 4 0.135 2.70 99.10 5 0.045 0.90 100.00 特征值1 对于相关矩阵, λ1的成分为主成分 Scree检验 nPC在2-3间斜率下降 因此d=2
文档评论(0)