- 6
- 0
- 约1.2万字
- 约 11页
- 2017-06-26 发布于河北
- 举报
(十三)因子分析
因子分析(Factor Analysis )
JerryLead
csxulijie@
2011 年5 月11 日
1 问题
( )
之前我们考虑的训练数据中样例x 的个数m 都远远大于其特征个数n,这样不管是进
行回归、聚类等都没有太大的问题。然而当训练样例个数 m 太小,甚至 mn 的时候,使
用梯度下降法进行回归时,如果初值不同,得到的参数结果会有很大偏差(因为方程数小于
参数个数)。另外,如果使用多元高斯分布(Multivariate Gaussian distribution)对数据进行拟合
时,也会有问题。让我们来演算一下,看看会有什么问题:
多元高斯分布的参数估计公式如下:
1
( )
μ = ∑
=1
1
( ) ( )
Σ = ∑ ( − μ)( − μ)
=1
( )
分别是求mean 和协方差的公式,x 表示样例,共有m 个,每个样例n 个特征,因此
μ是n 维向量,Σ是n*n 协方差矩阵。
| | −1
当mn 时,我们会发现Σ是奇异阵(Σ = 0 ),也就是说Σ 不存在,没办法拟合出多
元高斯分布了,确切的说是我们估计不出来Σ 。
如果我们仍然想用多元高斯分布来估计样本,那怎么办呢?
2 限制协方差矩阵
当没有足够的数据去估计Σ时,那么只能对模型参数进行一定假设,之前我们想估计出
完全的Σ (矩阵中的全部元素),现在我们假设Σ就是对角阵(各特征间相互独立),那么我
们只需要计算每个特征的方差即可,最后的Σ 只有对角线上的元素不为0
1
( )
Σ = ∑ ( − )2
=1
回想我们之前讨论过的二维多元高斯分布的几何特性,在平面上的投影是个椭圆,中心
点由μ决定,椭圆的形状由Σ决定。Σ如果变成对角阵,就意味着椭圆的两个轴都和坐标轴平
行了。
如果我们想对Σ进一步限制的话,可以假设对角线上的元素都是等值的。
= 2
其中
您可能关注的文档
- (十一)独立成分分析.pdf
- (十五)典型关联分析.pdf
- (十四)增强学习.pdf
- (十六)偏最小二乘法回归.pdf
- 002.杭州直面网络科技连锁有限公司.pdf
- 003.上海趣搭网络科技有限公司.pdf
- 004.四季管家粗略分析.pdf
- 004.四季管家分析版2.pdf
- 01-梧桐系列第一部 原创汇编(2015年鉴)截止11月1日.pdf
- 01课程考试试卷空白模板-1A.doc
- 广东省广州省实验中学教育集团2025-2026学年八年级上学期期中考试物理试题(解析版).docx
- 广东省广州大学附属中学2025-2026学年八年级上学期奥班期中物理试题(解析版).docx
- 广东省广州市第八十六中学2025-2026学年八年级上学期期中物理试题(含答案).docx
- 广东省广州市第八十九中学2025-2026学年八年级上学期期中考试物理试题(解析版).docx
- 广东省广州市第二中学2025-2026学年八年级上学期期中考试物理试题(含答案).docx
- 广东省广州市第八十六中学2025-2026学年八年级上学期期中物理试题(解析版).docx
- 广东省广州市第八十九中学2025-2026学年八年级上学期期中考试物理试题(含答案).docx
- 广东省广州市第二中学2025-2026学年八年级上学期期中考试物理试题(解析版).docx
- 2026《中国人寿上海分公司营销员培训体系优化研究》18000字.docx
- 《生物探究性实验教学》中小学教师资格模拟试题.docx
最近下载
- 电商数据分析(微课版)课件全套 第1--10章 电商数据分析概述---数据分析报告与看板制作.pptx
- 异常子宫出血的护理查房.pptx
- 2025年中医执业医师个人工作计划范文.docx VIP
- 2024《中班幼儿饮食行为现状调查—以S幼儿园为例》12000字.docx VIP
- 2025年美容美发十年行业数据洞察报告.docx
- 护理交接班制度.pptx VIP
- 初中电学总复习初中电学总复习.doc VIP
- 北京邮电大学《机器学习》2023-2024学年期末试卷.doc VIP
- 照顾老人保姆合同范本10篇.docx VIP
- 2024年锡林郭勒职业学院单招职业倾向性考试题库必考题.docx VIP
原创力文档

文档评论(0)