- 4
- 0
- 约2.94千字
- 约 20页
- 2019-01-14 发布于浙江
- 举报
商业数据分析 2016·11·24 线性降维 线性降维 2 1 PCA Principal Component Analysis 主成分分析法 线性降维 2 PCA 主成分分析(PCA)的方法可以解决数据降维和解相关性的问题。 PCA的思想是: 将p维的样本线性映射到k维空间上(kp)。而且,这k个维度是相互正交(不相关)的。 这k个方向就是主成分,并且是重新构造出来的,而不是简单地从原来p维中去除p-k维。 用数学语言来描述映射 线性降维 2 原始数据点是蓝色的六个点,我们要把它从一个 垂直正交二维空间投影到一条直线(一维空间)上。 假设这条黄色的直线,和原来的横轴角度为θ,我们定义一个投影矩阵P: 用原来的点的坐标构成的矩阵去乘以矩阵P,就完成了映射: 继续回到PCA 2 步骤: 1、每维数据都中心化。即每一列的数据都减去该列的均值:X——Xc 2、计算Xc的协方差矩阵S: 3、计算协方差矩阵S的特征向量和特征值; 求每个特征值lj 求aj构成的特征向量 线性降维 4、将特征值从大到小排列,选取前k个大的特征值对应的特征向量,也就是选出这p个特征中最重要的k个特征对应的特征向量。 5、将Xc映射到第4步计算出来的特征向量上,即Xc乘以这个特征向量,得到新的数据集Z。 这个新的数据集Z就是我们通过PCA处理原始数据后的结果啦! 那么问题来了? 2 K是多少? 线性降维 画
您可能关注的文档
- 沙头角景观技术标.doc
- 厦门大学《应用多元统计分析》第11章多变量可视化分析.ppt
- 山东省高校教育技术培训讲稿(修改稿).ppt
- 山东省济宁一中2016届高三化学复习二轮小专题精选练习专题101功能高分子材料.doc
- 珊纳特赛罗市政厅材料与构造.ppt
- 陕西省各高校分数预测模型.pdf
- 陕西省联通信息化报道.docx
- 陕西省暖通安装图集.pdf
- 商场市场消防安全管理规范.doc
- 商车改革费率改革方案介绍.pptx
- 基于知识图谱的初中英语阅读comprehension评测系统语义关联研究教学研究课题报告.docx
- 跨学科教学中人工智能应用对学生实践操作技能提升的实证研究教学研究课题报告.docx
- 小学体育课堂中体能训练的科学设计研究课题报告教学研究课题报告.docx
- 2026年广东省云浮市街道办人员招聘考试模拟试题及答案解析.docx
- 2026黑龙江新高考化学冲刺双一流名校试卷(附答案解析).docx
- 教师教学画像在教师教学团队建设中的协作模式与优化策略教学研究课题报告.docx
- 2026年智能物流行业应用场景报告.docx
- 2026年人工智能教育行业市场调研报告及发展前景分析.docx
- 2026年烟草行业转型自救与行业规范报告.docx
- 人工智能在跨学科教学中的应用与教师知识融合能力提升策略研究教学研究课题报告.docx
原创力文档

文档评论(0)