- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
聚类分析与单因素方差分析简介
初步分析: 1、思考:如果指标存在不同单位,例如收入(单位:元)、重量(单位:吨)、体积(单位:立方米)等 如何处理??标准化 2、如何衡量样本的相似性? 图示1:选2指标做平面图 图示2:所有指标折线图(但样本只选几个代表,如云南、贵州、四川、北京、上海、甘肃等) 比较得出结论:距离相似性、曲线相似性(用相关系数或夹角余弦衡量) 方法: 样本间距离——采用平方欧氏距离; 类间距离 ——采用组间平均距离连接法 此时,距离越小越相似!5、6最相似 类间距离——采用组间平均距离连接法 5.贵州 6.云南 4.四川 293.04 219.37 均值256.205 类间距离——采用组间平均距离连接法 图表阅读说明: 以stage 2为例 地区5在stage 1中出现过; stage 2这里的类,下一次将在第5步再次参与聚类,衔接地区是地区4 类似进行下去,可得聚类谱系图(树状图) 3、聚类过程与方法 构造关系矩阵 数据预处理 确定最佳分类 标准化 亲疏关系的描述 聚类 根据不同方法进行分类 类别数 1 2 3 4 (4)谱系分类的确定 经过系统聚类法处理后,得到聚类树状谱系图,Demirmen(1972)提出了应根据研究的目的来确定适当的分类方法,并提出了一些根据谱系图来分类的准则: 任何类都必须在临近各类中是突出的,即各类重心间距离必须极大 确定的类中,各类所包含的元素都不要过分地多 分类的数目必须符合实用目的 若采用几种不同的聚类方法处理,则在各自的聚类图中应发现相同的类 28个地区聚类图 二、方差分析 (ANOVA) (Analysis of Variance) 1、方差分析(ANOVA)引例 例2、某电器公司用四种不同配料方案生产出四批元件,在每一批元件中取出若干个分别装在整机中作寿命试验,得到如下数据(单位:小时) 元件 A1 1600 1610 1650 1680 1700 1720 1800 A2 1580 1640 1640 1700 1750 A3 1460 1550 1600 1620 1640 1660 1740 1820 A4 1510 1520 1530 1570 1600 1680 考察用不同的配料方案所生产的元件,其使用寿命有没有显著差异? 方差分析示例 思考1:这类分析有何作用? ?找出影响较大的因素,进行优化。 思考2:如何找出影响因素? ?可先尝试探索性分析,如下图 思考3:产生数据差异的原因? 数据差异 配料不同 思考4:同一配料方案下(条件相同),寿命仍有差异的原因? 即 条件不同 随机因素 数据差异 配料不同 随机因素 条件误差 随机误差 误差分解 条件变化对考察指标(元件寿命)影响不显著 条件变化对考察指标(元件寿命)有 显著影响 方差分析的基本思想: 数据差异 条件误差 随机误差 误差分解 2、单因素方差分析 只考察一个因素的变化对试验指标的影响,称为单因素方差分析。 通常,在单因子试验中,记因子为 A, 设其有s个水平,记为A1, A2,…, As。 在每一水平下考察的指标可以看成一个总体 ,现有 s 个水平,故有 s个总体, 假定: 每一总体均为正态总体,记为 N(?i ,? i 2),i=1, 2,…, s ; 各总体的方差相同: ? 1 2=? 22=…=? s2 =? 2 ; 从每一总体中抽取的样本是相互独立的, 即所有的试验结果 xij 都相互独立。 要比较各水平下的均值是否相同, 即要对如下的一个假设进行检验: H0 :?1 =?2 =…=?s (2.1) 备择假设为 H1 :?1, ?2, …, ?s 不全相等 在不会引起误解的情况下, H1 通常可省略不写。 离差平方和分解 单因素方差分析中可将试验数据列成如下形式: 样本组均值 样本总均值 数据间是有差异的。数据 与总平均 间的偏差可用 表示,它可分解为二个偏差之和 组内离差(偏差) 组间离差(偏差) 反映组内数据与组内平均的随机误差 反映第i个水平的效应 在统计学中,常用离差平方和来度量若干个数据分散的程度,记 总离差平方和 组内离差平方和 组间离差平方和 可证: 离差平方和分解 由抽样分布定理: 方差分析由来: 统计量由方差之比构造 离差平方和的统计性质及显著性检验 分析: 若因素A的变化对试验的影响显著,则分子应比分母大得多,从而统计量F的值较大; 若因素对试验结果的影响
您可能关注的文档
最近下载
- SICK西克KTS Core色标传感器操作手册.pdf VIP
- GB50345-2012 屋面工程技术规范.docx VIP
- 船舶油漆使用基本基础知识.pdf VIP
- 四年级(上)语文课文同步仿写、续写1.pdf VIP
- 9 天上有颗“南仁东星”课件(共30张PPT)2025-2026学年统编版语文八年级上册.pptx VIP
- 高级保育员课件.pptx VIP
- 第十章生态系统.ppt VIP
- 《脑卒中运动障碍康复护理规范》.pdf VIP
- 2012年全国创新杯说课大赛作品汇总铰链四杆机构的类型及判定说课(新蓝).ppt VIP
- 年处理80吨茯苓提取车间提取工段工艺设计-毕业论文(设计).doc VIP
文档评论(0)