- 1、本文档共45页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
应用统计学 马昕 经济学教研室 电话Email: maxin@ncepu.edu.cn 教材:何晓群《多元统计分析》,中国人民大学出版社,2004 参考书 何晓群《现代统计分析方法与应用》,中国人民大学出版社,1998 王学民《应用多元分析》,上海财经大学出版社 Jams M Lattin等著,《多元数据分析》(英文版),机械工业出版社 考核方法: 读书报告:30分(考试前交) 期末考试(开卷) :70分 课程内容: 第一章 绪论 第二章 向量、矩阵与多维正态分布 第三章 聚类分析 第四章 判别分析 第五章 方差分析 第六章 回归分析 第七章 主成分分析 第八章 因子分析 第九章 对应分析 第十章 结构方程模型 第一章 绪论 多元数据分析的必要性 多元数据分析方法概论 多元数据的描述 统计基本知识回顾 一、多元数据分析的必要性 信息时代——数据时代,决策:经验→科学 经济发展 科学研究 军事 企业组织——信息组织 市场分析 投资决策 设备管理 数据分析 从大量数据中发现尽可能多的有用信息,从而把握事物特征的过程 每个数据:反映某个事物某一方面的特征 统计学:单变量/双变量分析 描述统计 集中趋势 离散趋势 变量分布 异常点 推断统计:从样本统计量推断总体参数 参数估计:样本均值估计总体均值, 假设检验:总体均值或方差的检验,两总体均值/方差相等的检验 相关分析:两个随机变量间的(线性)相关程度 回归分析:一个随机变量和一组随机变量间的依存/相关关系 为什么需要多元数据? 一般来说事物通常具有多面性,即每一事物有多方面特征 例:学生的能力、物种、国家经济实力、企业竞争力 仅从一个方面往往不足以反映事物特性或个体之间的差异 必须全面考虑事物的各个方面,才能对其正确认识。 Simpson’s Paradox Example: 44% of male applicants are admitted by a university, but only 33% of female applicants Does this mean there is unfair discrimination? University investigates and breaks down figures for Engineering and English programmes Simpson’s Paradox No relationship between sex and acceptance for either programme So no evidence of discrimination Why? More females apply for the English programme, but it it hard to get into More males applied to Engineering, which has a higher acceptance rate than English Must look deeper than single cross-tab to find this out Simpson’s Paradox In this example, the bivariate analysis (cross-tabulation or correlation) gave misleading results Introducing another variable gave a better understanding of the data It even reversed the initial conclusions 二、多元数据分析过程及方法 多元数据分析方法概述 多元分析的目的:探索数据的模式(结构) 多元数据分析的难点: 维度太多使我们难以发现规律、把握重点 多元分析方法的核心:概要和简化 工具:矩阵代数、统计软件(SAS,SPSS, Stata等) 具体方法 聚类分析:按距离远近分类 判别分析: 给定样本定类——亲疏判别 主成分分析、因子分析、对应分析:找出主要因素,化简数据 方差分析 多元回归分析 结构方程模型 课程重点 强调方法的应用而非理论推导 强调方法的内涵与几何解释 强调SPSS软件的应用和结果的解释 三、多元数据的描述 数据的计量尺度(measurement scale):告诉我们从数据中可获得哪些信息。 品质数据:计算无意义 定类尺度:按穷尽和互斥原则将对象某种特征归类 通常用虚拟变量表示: 定序尺度 对象特征等级或顺序差别的测度 三、多元数据的描述 数值数据 定距尺度:测度对象特征的间距,不能做绝对比较。 定比尺度:即可测度间距,又
文档评论(0)