- 1、本文档共105页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
化学计量学-主成分的分析-倪力军.ppt
根据theta向量得 y=95.66+7.78x1+4.19x2-0.96x3-6.26x4 (6-75) 打开STAUS得:STATUS= 0.9888 2.16 1.8262 0.9881 131.64 3.8625 根据其第一个数值可知(6-75)给出的因变量 值与其实际值之间的相关系数r=0.9888;第2 个数值表明(6-75)的均方根残差RMSEC= 2.16;其第3个数值表明(6-75)给出的因变量平 均绝对残差=1.8262;其第4个数值表明(6-75) 的复相关系数=0.9881;由第5,6个元素的值 可知F=131.64 Fcrit=3.86 打开输出变量t与Tcrit得: t= 36.8588 76.7963 -5.2900 -132.6781 Tcrit=2.3060 每个t的绝对值均大于Tcrit,表明plsr回归方程(6-75)的4个回归系数均通过了统计检验 Plsr回归方程(6-75)中y与各自变量的关系与例4-3中表4-5所呈现的水泥凝固时释放热量y与变量x1,x2呈正相关、与x3和x4负相关的规律一致。 Plsr避免了例4-3中直接多元线性回归得到的回归系数不能通过统计检验、所得回归方程中y与某些变量的关系与实际情况不一致的现象 思考题 为何本例(例6-6)采用plsr得到的回归方程(6-75)与实际因变量、自变量的关系一致? 为何例4-3直接多元线性回归得到的回归方程(4-18)与实际因变量、自变量的关系不完全一致? 本章小结-PCA的重要概念 主成分分析(PCA)是一种信息压缩方法,它将原始变量从p维空间压缩到m维(mp),得到新的变量—主成分得分。 主成分(得分)是一组方差由大到小排列的、以原始变量的线性组合(线性组合系数为特征向量的元素)表示的新变量,协方差矩阵特征向量构成了新的坐标空间—称为主成分轴,特征值即对应主成分的方差。 本章小结-PCA的重要概念 特征值大的主成分所含信息量也大,可根据特征值大小确定主成分个数,从而用较少的主成分代替原始变量,实现对原始数据的信息压缩和特征抽提。 本章小结-主成分的用途 变量评估 信息压缩 复杂物质体系的多元分辨 模式识别中的特征抽提 回归建模-PCR,延伸-PLSR 本章小结-应用PCA时的注意事项 对于变量间数量级差异大的数据矩阵,一定要进行自标度化预处理使其量级在同一水平后再进行PCA。否则,会出现谬误的分析结果(见P249及上次课PPT相关讨论)。 主成分回归(Principal Component Regression,PCR) 问题的提出:例6-1 例6-1的原理(K矩阵法) 缺点:需要2次求逆 ,吸光度矩阵存在较高 的相关性时,第二步求逆会带来很大误差。 (6-3) P矩阵法 缺点:(1)需要构造多于p个的建模样本, 或者挑选小于n的波长通道;(2)吸光度矩 阵Y中的行或列存在较高的相关性时,P的 求解仍不可避免地有很大误差! 问题的提出:另一个例子 直接采用原始数据回归分析 在MATLAB中导入数据矩阵X(11行4列,第一列为单位向量)与Y(11行1列),然后键入命令: [b,bz,s,sz,rf]=regress(Y,X); 根据向量b可得: Y=-10.128 -0.0514X1+ 0.587X2+ 0.2869X3 从rf的第1个值可知R2=0.9919,从rf的第2个值可知统计变量F=285.61 F0.01(3,7)=8.4513F0.05(3,7)=4.3468 上述回归方程虽然通过了统计检验,但其反映的规律——进口原料总额Y与GDP成负相关关系,与实际数据间的规律不符。 原因:自变量间的高度线性相关性导致矩阵XTX病态(计算发现,矩阵XTX的条件数=35719,一般认为条件数大于30即为病态矩阵) 对本例中的X矩阵(即例6-2)自标度化处理后进行PCA,其协方差矩阵的特征值为1.9992,0.9982与0.0027,累积贡献率分别为:66.64%, 99.91%与100% 说明X矩阵中的三个变量只有2个独立,故只取前2个主成分进行回归分析 在MATLAB下输入如下命令 ax=autoscaling(X(:,2:4)); [pc,sc,la]=princomp(ax); tx=[ones(11,1) sc(:,1:2)]; [Bt,bin,rt,bf,St]=regress(Y,tx); 由Bt可知: Y=21.891+3.135*sc(1)+0.869*sc(2) 由St可知:R2= 0.98828,F=337.23 故上述主成分回归方程通过统计检
您可能关注的文档
最近下载
- 中国通讯电缆行业市场前景预测及投资战略研究报告.docx
- 国网公司科技项目可行性研究报告.docx
- 2024年芜湖职业技术学院单招职业适应性测试题库新版.docx
- 2024届高考语文复习:(议论文、小说、古诗词、修辞手法等答题规范)课件.pptx
- 1.广东省高职院校高水平专业群建设项目申报书(计算机应用技术专业群).doc VIP
- 预算绩效评价工作方案.docx VIP
- 人力资源管理概论第5版全套PPT课件-人大董克用.pptx VIP
- 2025年中国财富管理市场供需现状及投资战略研究报告.docx
- 2024年加油站岗位工作人员安全知识考试题(含答案).pdf
- 【校本课程教材】物理学史教材.pdf
文档评论(0)