- 5
- 0
- 约2.95万字
- 约 308页
- 2018-05-08 发布于河北
- 举报
信息分析与预测 耿锁奎
* §2 数学模型与几何解释 假设我们所讨论的实际问题中,有p个指标,我们把这p个指标看作p个随机变量,记为X1,X2,…,Xp,主成分分析就是要把这p个指标的问题,转变为讨论p个指标的线性组合的问题,而这些新的指标F1,F2,…,Fk(k≤p),按照保留主要信息量的原则充分反映原指标的信息,并且相互独立。 * 这种由讨论多个指标降为少数几个综合指标的过程在数学上就叫做降维。主成分分析通常的做法是,寻求原指标的线性组合Fi。 * 满足如下的条件: 主成分之间相互独立,即无重叠的信息。即 主成分的方差依次递减,重要性依次递减,即 每个主成分的系数平方和为1。即 * 主成分的几何意义 主成分分析数学模型中的正交变换,在几何上就是作一个坐标旋转。因此,主成分分析在二维空间中有明显的几何意义。假设共有n个样品,每个样品都测量了两个指标(X1,X2),它们大致分布在一个椭圆内如图所示。事实上,散点的分布总有可能沿着某一个方向略显扩张,这个方向就把它看作椭圆的长轴方向。显然,在坐标系x1Ox2中,单独看这n个点的分量X1和X2,它们沿着x1方向和x2方向都具有较大的离散性,其离散的程度可以分别用的X1方差和X2的方差测定。如果仅考虑X1或X2中的任何一个分量,那么包含在另一分量中的信息将会损失,因此,直接舍弃某个分量不是“降维”的有效办法。 * 主成分的几何意义 * * 易见,n个点在新坐标系下的坐标Y1和Y2几乎不相关。称它们为原始变量X1和X2的综合变量,n个点y1在轴上的方差达 到最大,即在此方向上包含了有关n个样品的最大量信息。 因此,欲将二维空间的点投影到某个一维方向上,则选择y1 轴方向能使信息的损失最小。我们称Y1为第一主成分,称Y2 为第二主成分。第一主成分的效果与椭圆的形状有很大的关 系,椭圆越是扁平,n个点在y1轴上的方差就相对越大,在y2 轴上的方差就相对越小,用第一主成分代替所有样品所造成的信息损失也就越小。 * 一种是椭圆的长轴与短轴的长度相等,即椭圆变成圆,第一主成分只含有二维空间点的约一半信息,若仅用这一个综合变量,则将损失约50%的信息,这显然是不可取的。造成它的原因是,原始变量X1和X2的相关程度几乎为零,也就是说,它们所包含的信息几乎不重迭,因此无法用一个一维的综合变量来代替。 另一种是椭圆扁平到了极限,变成y1轴上的一条线,第一主成分包含有二维空间点的全部信息,仅用这一个综合变量代替原始数据不会有任何的信息损失,此时的主成分分析效果是非常理想的,其原因是,第二主成分不包含任何信息,舍弃它当然没有信息损失。 * ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 主成分分析的几何解释 平移、旋转坐标轴 * ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 主成分分析的几何解释 平移、旋转坐标轴 ? * ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 第一种极端情况 平移、旋转坐标轴 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? * ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 第二种极端情况品 平移、旋转坐标轴 ? * A p1 p2 p3 p4 p5 p6 p1 1 1 1 4 1 1/2 p2 1 1 2 4 1 1/2 p3 1 1/2 1 5 3 1/2 p4 1/4 1/4 1/5 1 1/3 1/3 p5 1 1 1/3 3 1 1 p6 2 2 2 3 1 1 判断矩阵 求出目标层的权数估计 用和积法计算其最大特征向量 * 和积法具体计算步骤: 将判断矩阵的每一列元素作归一化处理,其元素的一般项为: bij= aij ?1naij (i,j=1,2,….n) * A p1 p2 p3 p4 p5 p6 p1 1 1 1 4 1 1/2 p2 1 1 2 4 1 1/2 p3 1 1/2 1 5 3 1/2 p4 1/4 1/4 1/5 1 1/3 1/3 p5 1 1 1/3 3 1 1 p6 2 2 2 3 1 1 ?
您可能关注的文档
- 锦江之星媒介投放计划及建议2012年8月16日.ppt
- 锂离子动力电池的安全性问题-艾新平武汉大学.ppt
- 面向GeoEvent的实时空间数据使用与开发谢永强.pptx
- 露天转地下开采课件.ppt
- 马自达阿特兹首批用户研究项目-总报告精编.pptx
- 麟恒中心广场2期营销中心开 放-v2.0课件.pptx
- 龙力企业宣传画册设计提案精选.ppt
- 万科-城市高尔夫花园整合提案 整合推广策略沟通纲要.ppt
- 万用表使用培训教材 鹰江公司.ppt
- 龙门山国际山地旅游大区策划推荐.ppt
- 2026年及未来5年内中国液体氩气行业投资前景及策略咨询研究报告.docx
- 2026年及未来5年内中国黄铜合页行业投资前景及策略咨询研究报告.docx
- 2026年及未来5年内中国竹工艺家具行业投资前景及策略咨询研究报告.docx
- 2025年中国微机数显自动分析仪市场调查研究报告.docx
- 2026年及未来5年内中国微尘白色粉笔行业投资前景及策略咨询研究报告.docx
- 2025年中国微电脑型压胶机市场调查研究报告.docx
- 2026年及未来5年内中国数字化等功游泳训练测试系统行业投资前景及策略咨询研究报告.docx
- 2025年中国圆形花瓶市场调查研究报告.docx
- 2026年及未来5年内中国植物纤维静淀过滤器行业投资前景及策略咨询研究报告.docx
- 2025年中国超音波手套机市场调查研究报告.docx
最近下载
- 辽宁省 新民县志.pdf
- 2026年上海市奉贤区高三语文一模试题及答案.pdf VIP
- 夏季高温施工专项方案.doc VIP
- 第五届大学生节能减排大赛社会调查报告类作品.doc VIP
- TCCSAS 061-2025 特殊作业监护人履责管理要求.pdf VIP
- (一模)东北三省三校2026年高三第一次联合模拟考试 生物试卷(含答案).docx
- 2025年广东省深圳市中考数学试卷(附参考答案).pdf VIP
- (一模)东北三省三校2026年高三第一次联合模拟考试 化学试卷(含答案).pdf
- 【雷赛】DMC1000&B用户手册V2.1.pdf VIP
- (一模)东北三省三校2026年高三第一次联合模拟考试 物理试卷(含答案详解).pdf
原创力文档

文档评论(0)