- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
rzhao@ session 3 聚类分析 应用多元统计分析及SPSS应用 Session 3 统计数据的收集、整理与描述 统计数据的来源 应该注意的是,SPSS 在未特别指定的情形下,直方图或频数分布表是按照原始数值逐一作频数分布的,这与日常需要的等距分组、且组数保持在一定数目的要求不符。 在调用[Frequencies]统计过程命令之前,可先对原始数据进行预处: 已知最小值为84,最大值为128,全距为10,故可要求分成5 组,起点为80,组距为10。 选择[Transform]=[Recode]=[Into Different Variable...],在弹出的[Recode Into Different Variable]对话框中选定X,单击按钮使之进入[Numeric Variable→Output Variable]列表框,在[OutputVariable]栏的[Name]文本框中输入x1,单击[Change]按钮表示新生成的变量名为x1。 单击[Old and New Values]按钮弹出[Recode Into Different Variable:Old and New Values]子对话框,在[Old Value]选项中单击[Range]项,输入第一个分组的数值范围:80~89,在[New value]栏内输入新值:80,单击[Add]按钮. 依此将各组的范围及对应的新值逐一输入,最后单击[Continue]按钮返回,再单击[OK]按钮即完成。系统在原数据库中生成一新变量为x1,这时再调用[Frequencies]统计过程将输出等距分组且组数为5 的频数分布表。 二、分布的形状 用于描述数据分布形状即分布关于其中心的波动程度的代表值有:极差、内距、方差和标准等,它们描述了分布的离散程度和差异程度。 (一)极差(range) 极差也称为全距,是最大值与最小值之间的距离,它是数据离散或差异程度的最简单测度值,即 例如,在前面的数据中,极差为128-84=44(件)。显然,数据的离散程度大,极差就越大。极差虽然很容易计算,但它只告诉我们数据分布范围,至于分布的中间部分是如何变化的则不得而知。而且它受极端值的影响可能是很大的。 输宫奋鼎媳护秦烈江嚼冤歧率女坊蛊菠羌茧蛤缴烟毯枯侠犬涵地段舒储倚多元统计分析及SPSS应用多元统计分析及SPSS应用 (二)内距(Inter-Quartile Range, IQR) 内距又称为四分位差,是两个四分位数之差,IQR=高四分位数—低四分位数。 若内距比较小,则说明数据比较集中在中位数附近;反之则比较分散。内距常和中位数一起用来描述一个定距特别是定序测量数据的分布。 (三)方差(variance)和标准差(standard deviation) 方差是离差平方的平均数,即 或 挣滓碍赣蕴资供背濒抉拴傣轧殿滴慰评撵活赊处鬼颠涧了说剩叙惜盛捌可多元统计分析及SPSS应用多元统计分析及SPSS应用 三、偏度与峰度 (一)偏度(skewness) 所谓偏度是指反映频数分布偏态方向和程度的测度。 在频数分布中,最大集中点以上(频数曲线图横轴上众数的右边)的频数占总频数的一半多,称为右偏或正偏。 最大集中点以下(频数曲线图横轴上众数的左边)的频数占总频数的一半多,称为左偏或负偏。 偏度的计算公式为: 诉增品缘衡哇揖畏师库显视倪钡囤慑孰次紊贸磐蛀怀资记菌般僧茁况糕陛多元统计分析及SPSS应用多元统计分析及SPSS应用 (二)峰度(kurtosis) 所谓峰度,是指频数分布曲线高峰的形态,即反映分布曲线 的尖峭程度的测度。 峰度的计算公式为 当β=0 时,表示分布的峰度是正态分布的峰度;当β0 时,表示分布曲线的高峰是尖顶高峰;当β0 时,表示分布曲线的高峰是平顶高峰。 病吱芳玫撇犊倾箍苏澡横帖尔媚必纂谰曰辊骸援李瓶萍揣皋匣磕箕斩蝎尔多元统计分析及SPSS应用多元统计分析及SPSS应用 四、SPSS 操作 在SPSS 中计算上例各种指标的步骤为: (一)定义加工零件数的变量名为X,并输入原始数据。 (二)选择[Analyze
文档评论(0)