- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据分析方法及理论详解PPT
方差分析中的有关术语 4、变量 分类型变量:即自变量,如上例中的行业。 数值型变量:即因变量,如上例中的被投诉次数 当研究分类型自变量对数值型因变量的影响时,所用的方法就是方差分析法,上例中也就是“行业”对“被投诉次数”的影响。 基本知识 说出在本例中的因子、水平、观测值、变量分别是什么? 基本知识 单因素方差分析的数据结构(one-way analysis of variance) 基本知识 提出假设 一般提法 H0 : m1 = m2 =…= mk 自变量对因变量没有显著影响 H1 : m1 ,m2 ,… ,mk不全相等 自变量对因变量有显著影响 注意:拒绝原假设,只表明至少有两个总体的均值不相等,并不意味着所有的均值都不相等 基本知识 单因素方差分析表(基本结构) 基本知识 单因素方差分析(例题分析) 基本知识 统计决策 ? 将统计量的值F与给定的显著性水平?的临界值F?进行比较,作出对原假设H0的决策 根据给定的显著性水平?,在F分布表中查找与第一自由度df1=k-1、第二自由度df2=n-k 相应的临界值 F? 若FF? ,则拒绝原假设H0 ,表明均值之间的差异是显著的,所检验的因素对观察值有显著影响 若FF? ,则不能拒绝原假设H0 ,无证据支持表明所检验的因素对观察值有显著影响 基本知识 用EXCEL进行单因素方差分析 工具——数据分析——方差分析-单因素方差分析 工具 1.三值都是希望通过一个数值来描述整体特征,以便简化资料。都是反映了变量的集中趋势。 众值:适用于定类、定序和定距变量 中位值:适用于定序和定距变量 均值:适用于定距变量。 2.众值仅使用于了资料中最大频次数,因此,资料使用是不完全的;中位值只考虑了变量的顺序和居中位置,对不按序排序的数,不在中位的数值的大或小反映不出来;均值既考虑到频次,又考虑到变量值的大小,因此,反映最灵敏。 3.虽然均值对资料信息利用最充分,但对严重偏态的分布,会失去它应有的代表性。只对单峰和基本对称的图形,用均值作为集中趋势才是合理的。对偏态的分布,应使用中位值作为集中趋势。 众数、中数和均数的比较 基本知识 偏态和三值的关系 对称图形 偏态图形 偏态图形 众值 中位值 均值 众值 中位值 均值 众值 均值 中位值 基本知识 2月员工AHT,哪一组表现好?哪组表现差? 案例 孟子说“物之不齐,物之性也”。乃佛家之殊相 差异来自于大量现象的异质性或多变性 大量现象相异之外,有其相同的一面。但经常是相异之处比相同之处更为显著。 统计分析的主题,便是一套研究差异的技术。 离散趋势 基本知识 是测定总体中各个个体单位标志值差异的变动范围或差异程度的指标。 离散趋势 集中趋势 基本知识 为什么说图中的两个城市,一个“四季分明”,一个“四季温差不大”? 基本知识 甲,乙两名射击手的测试成绩统计如下: ⑴ 请分别计算两名射手的平均成绩; 教练的烦恼 甲 乙 ⑶ 现要挑选一名射击手参加比 赛,若你是教练,你认为挑 选哪一位比较适宜?为什么? 成绩(环) 射击次序 0 1 2 2 3 4 5 4 6 8 10 ⑵ 请根据这两名射击手的成绩在 下图中画出折线统计图; 基本知识 测量的是数据的分散程度,就是样本中最大值与最小值之差。 反映标志值的变动范围 极差计算简便,易于理解,应用普遍。 极差=最大标志值-最小标志值 极差 基本知识 一组数据中,各数据与它们的平均数的差的平方的平均数。 方差 计算公式: 一般步骤: 求平均-再求差-然后平方-最后再平均 基本知识 例: 为了考察甲、乙两种小麦的长势,分别从中抽出10株苗,测得苗高如下(单位:cm): 甲: 12 13 14 15 10 16 13 11 15 11 乙: 11 16 17 14 13 19 6 8 10 16 问哪种小麦长得比较整齐? 方差越大, 波动越大,越不稳定。 基本知识 标准差是一组数值自平均值分散开来的程度的一种测量观念。 一个较大的标准差,代表大部分的数值和其平均值之间差异较大;一个较小的标准差,代表这些数值较接近平均值。 数据的单位与方差的单位一致吗? 标准差 基本知识 偏度 理想的分布形态是对称的,但在现实生活中,现象之分布并不完全对称,而是或多或少地不同程度地存在着非对称情况,在统计上将这个非对称分布称为偏态。 表征概率分布密度曲线相对于平均值不对称程度的特征数。 基本知识 偏度 如果偏度=0,则表
文档评论(0)