- 1、本文档共77页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据分析(二)
《数据分析》讲座 * * ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 主成分分析的几何解释 平移、旋转坐标轴 ? 《数据分析》讲座 * * ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 主成分分析的几何解释 平移、旋转坐标轴 ? 《数据分析》讲座 * * 假设我们所讨论的实际问题中,有p个指标,我们把这p个指标看作p个随机变量,记为X1,X2,…,Xp,主成分分析就是要把这p个指标的问题,转变为讨论p个指标的线性组合的问题,而这些新的指标F1,F2,…,Fk(k≤p),按照保留主要信息量的原则充分反映原指标的信息,并且相互独立。 主成分分析的几何解释 《数据分析》讲座 * * 主成分分析通常的做法是,寻求原指标的线性组合Fi。 主成分分析的几何解释 《数据分析》讲座 * * 满足如下的条件: 主成分之间相互独立,即无重叠的信息。即 主成分的方差依次递减,重要性依次递减,即 每个主成分的系数平方和为1。即 主成分分析的几何解释(续) 《数据分析》讲座 * * 计算原理: 设X为p维随机向量,协方差阵为V,V的p个特征根记为 ,对应的标准正交化的特征向量为 ,则X的第i个主成分为 ,且 。 求主成分的问题可转化为求X的协方差阵V的特征根和标准化特征向量的问题,归纳为以下几个步骤: (1)求X的协方差阵V的前m个特征根,记为 ; (2)求 对应的单位化特征向量 ; (3)得到X的第个主成分为 。 主成分分析的计算 《数据分析》讲座 * * 主成分个数的取定 设X为p维随机向量,出于降维的目的,一般取m个主成分,且 。在应用中自然要考虑应取多大为合适。取值原则是,在保证数据信息量损失不超过事先给定的阈值的前提下,取最少的主成分个数。 我们分别称 , 为第i个主成分的贡献率和前m个主成分的贡献率。经验表明,通常取使前m个主成分的累计贡献率达到80%以上即可。 主成分分析的计算 《多元统计分析》讲座 * * Fl,F2除了可以对包含在Xl,X2中的信息起着浓缩作用之外,还具有不相关的性质,这就使得在研究复杂的问题时避免了信息重叠所带来的虚假性。二维平面上的个点的方差大部分都归结在Fl轴上,而F2轴上的方差很小。Fl和F2称为原始变量x1和x2的综合变量。F简化了系统结构,抓住了主要矛盾。 主成分分析的优点 《数据分析》讲座 * * 五、回归分析 回归分析是研究变量相关关系的一种统计工具,即研究一个变量与一个或几个解释变量之间的相互依存关系。目标是运用统计推断的方式去推断变量间相关关系的有无和相关关系的形式。 在一元统计分析中也有多元回归,它指的是多个自变量对一个因变量的回归问题,而多元回归是多个自变量是多个因变量的回归。 《数据分析》讲座 * * 5.1 线性回归模型 下表和下图给出了12个小学生的年龄与身高的数据 , 《数据分析》讲座 * * 由上面的图表可以看出,12个样本点大致分布在图中所示的直线附近。这条直线我们称之为回归直线,该直线的模型 称为回归模型,x称为回归自变量,y称为回归的因变量, 称为随机扰动项。由于上述方程中只含一个自变量,故又称之为一元回归模型。 更一般地,因变量y与多个自变量 有如下线性关系 假设已经获得n个观测样本点,即有数据 于是有 《数据分析》讲座 * * 下面我们仍然采用向量形式对上述回归方程进行描述。记 , , 则上述回归方程可以写成 这就是多元线性回归模型。 《多元统计分析》讲座 * * 5.2 线性回归模型的参数估计 对于线性回归模型,我们希望选择参数 ,使得 为最小,
您可能关注的文档
最近下载
- 中华民族共同体概论教案合集(第一讲-第十六讲)附《中华民族共同体概论》课程大纲.doc VIP
- “中华民族共同体概论”课程教学与建设关键问题探讨.docx VIP
- 诸侯纷争与变法运动【课件】.pptx VIP
- 中国高血压防治指南(2024年修订版)_中国高血压防治指南修订委员会__.pdf VIP
- “扬子石化杯”2024年第38届中国化学奥林匹克(江苏赛区)初赛化学.pdf VIP
- 民事诉讼法中案外第三人对执行的异议之诉.pdf VIP
- 车险承保方案.pdf VIP
- “扬子石化杯”2024年第38届中国化学奥林匹克(江苏赛区)初赛化学试卷含答案.pdf VIP
- 临海市城市生活垃圾焚烧发电厂扩建工程环境影响报告.pdf
- 2025内蒙古鄂尔多斯市公安机关招聘留置看护警务辅助人员115人笔试参考题库附答案解析.docx VIP
文档评论(0)