多元统计分析.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

多元统计分析中国人民大学统计学院杜子芳课程介绍课程内容:介绍各种多元分析方法讨论各种方法的联系,优缺点……考核方式:期末小论文公共邮箱:rucdy2009@126.com(密码ruc2009)助教:刘亚文liuyawen1985@126.com推荐参考书目张尧庭,方开泰,《多元统计分析引论》,北京:科学出版社,1982。高惠璇,《应用多元统计分析》,北京:北京大学出版社,2005。陈峰,《医用多元统计分析方法》,北京:中国统计出版社,2000。[美]RichardA.Johnson,DeanW.Wichern著,陆璇叶俊译,《实用多元统计分析》(第6版),北京:清华大学出版社,2008。多元统计分析的数据结构n个样品p个变量的数据n个样品(样本点/case)p个变量(指标/variable)多元统计分析的数据结构(续)变量的分类性质分类顺序数值——定量(quantitative)功能自变量因变量三类变量三类变量的举例分类:姓名,性别,民族,籍贯顺序:学历,“成份”,职称数值:身高,收入,年龄变量对应的数据容许的最高计算等级分类 ??顺序 ??数值 ??三种数据的变化升级变化手段:编码后果:计算高级化信息可能扭曲降级变化手段:分组后果:计算低级化信息可能减少一个降级的例子学生成绩原本是数值数据:0~100分分组后成顺序数据:优,良,中,及格,差后果:无法进行加减计算了。信息减少,95与100分的差异不见了。课程框架自变量之间的关系聚类分析主成分分析因子分析自变量与因变量之间的关系多元分析的描述统计描述统计量均值向量方差和协方差矩阵相关系数矩阵图形散点矩阵图三维曲面图轮廓图闪电图雷达图调和曲线图切尔谢夫脸谱图一元分析的描述统计量分类变量的数字特征集中性趋势:众数分散性趋势:异众比例顺序变量的数字特征集中性趋势:中位数分散性趋势:四分位数数值变量的数字特征集中性趋势:平均值分散性趋势:标准差多元的描述统计量——均值向量集中趋势,平均水平第一个变量的平均值第k个变量的平均值p个变量的均值向量多元的描述统计量——方差和协方差矩阵方差表示变量离散程度,协方差变量间的协同关系变量k的方差变量i和变量k的协方差变量i越大,变量k越大,则协方差为正数;变量i越大,变量k越小,则协方差为负数;若两个变量关系不大,则协方差接近0当i=k时多元的描述统计量——方差和协方差矩阵多元的描述统计量——相关系数矩阵第i个和第k个变量的相关系数为相关系数是协方差的标准化形式;相关系数的取值在-1到+1之间;相关系数衡量的是变量间线性关系的强度多元的描述统计量——相关系数矩阵图形散点矩阵图——多个变量之间的关系三维曲面图——两个变量的联合分布轮廓图闪电图雷达图调和曲线图切尔谢夫脸谱图散点图矩阵——多个变量间的关系p=2时,可以用散点图表示两个变量之间的关系p2时,对p个变量两两配对生成散点图矩阵散点图矩阵——多个变量间的关系三维曲面图轮廓图横坐标取p个点,表示p个变量;对于某一样品,纵坐标表示每个变量的取值,将p个点用直线连起来;依次画n个样品的图。轮廓图闪电图类似于轮廓图旋转90度直观上便于各样品之间的比较柱形图vs条形图雷达图作一圆,将圆周p等分;连接圆心和各分点,这p条半径即为p个坐标轴;将每一个样品的p个变量取值分别标注在p个坐标轴上,用直线连接成p边形;n个样品即有n个p边形。调和曲线图Andrews,1972提出用二维空间的一条曲线表示多维空间的点各变量数值悬殊时,要先标准化同类的曲线拧在一起,不同类拧成不同的束切尔诺夫脸谱图每个样品用一个脸谱表示用脸部特征如脸的长度、高度、眼睛大小、发型等表示各变量的值可以根据脸的相似程度,将样品分组无法在同一框架下进行比较Chernoff,H.“UsingFacestoRepresentPointsinK-DimensionalSpaceGraphically.”(1973)多元统计学的应用——文学《红楼梦》作者研究(文本挖掘)选定数十个与情节无关的虚词,把《红楼梦》120回作为120个样品,统计每一回选定的这些虚词出现的频数作为变量方法:聚类分析李贤平,“红楼梦成书新说”,《复旦学报》社会科学版,1987年第5期多元统计学的应用——营销消费者偏好研究消费者对具有不同属性的各种产品进行打分,用

文档评论(0)

金华 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档