- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第一讲——数据的描述性分析
哪名运动员的发挥更稳定? 在奥运会女子10米气手枪比赛中,每个运动员首先进行每组10枪共4组的预赛,然后根据预赛总成绩确定进入决赛的8名运动员。决赛时8名运动员再进行10枪射击,再将预赛成绩加上决赛成绩确定最后的名次。 在2008年8月10日举行的第29届北京奥运会女子10米气手枪决赛中,进入决赛的8名运动员的预赛成绩和最后10枪的决赛成绩如下表: 哪名运动员的发挥更稳定? 最后的比赛结果是,中国运动员郭文珺凭借决赛的稳定发挥,以总成绩492.3环夺得金牌,预赛排在第1名的俄罗斯运动员纳塔利娅·帕杰林娜以总成绩489.1环获得银牌,预赛排在第4名的格鲁吉亚运动员妮诺·萨卢克瓦泽以总成绩487.4环的成绩获得铜牌,而预赛排在第3名的蒙古运动员卓格巴德拉赫·蒙赫珠勒仅以479.6环的成绩名列第8名。 由此可见,在射击比赛中,运动员能否取得好的成绩,发挥的稳定性至关重要。那么,怎样评价一名运动员的发挥是否稳定呢?通过本章内容的学习就能很容易回答这样的问题。 数据分布的特征 四分位数—用3个点等分数据(quartile) 排序后处于25%和75%位置上的值 众数、中位数、平均数的特点和应用 平均数 易受极端值影响 数学性质优良,实际中最常用 数据对称分布或接近对称分布时代表性较好 中位数 不受极端值影响 数据分布偏斜程度较大时代表性接好 众数 不受极端值影响 具有不惟一性 数据分布偏斜程度较大且有明显峰值时代表性较好 离散系数 (例题分析) 【 例 】评价哪名运动员的发挥更稳定 Excel中的统计函数 MODE—计算众数 MEDIAN—计算中位数 QUARTILE—计算四分位数 AVERAGE—计算平均数 HARMEAN—计算简单调和平均数 GEOMEAN—计算几何平均数 AVEDEV—计算平均差 STDEV—计算样本标准差 STDEVP—计算总体标准差 SKEW—计算偏态系数 KURT—计算峰态系数 TRIMMEAN—计算切尾均值 用Excel和SPSS计算描述统计量 SPSS?【Analyze】?【Descriptive statistics】?【Descriptives】?【variables】(选入变量)?【Options】(选择需要的描述统计量)?【Continue】?【OK】 数据的描述统计量 2.1.1极差与四分位差 极差也叫全距,是一组数据的最大值与最小值之离差,即: 四分位差是指第三四分位数与第一四分位数之差,也称为内距或四分间距,计算公式为: 2.1.2平均差 平均差也称平均离差,是各变量值与其平均数离差绝对值的平均数,通常用 表示。 ◆简单式平均差 ◆加权式平均差 简单式平均差 加权式平均差 2.1.3标准差与方差 标准差又称均方差,它是各单位变量值与其平均数离差平方的平均数的方根,通常用 表示。它是测度数据离散程度的最主要方法。 方差是各变量值与其算术平均数离差平方和的平均数,即是标准差的平方,用 表示总体的方差;用 表示样本的方差。 ◆总体与样本标准差 ◆简单式标准差 ◆加权式标准差 简单式标准差 加权式标准差 总体与样本标准差 简单式 加权式 总体 样本 2.2相对指标 对平均数不等或计量单位不同的不同组别的变量值,是不能直接用离散程度的绝对指标比较其离散程度。为了消除变量平均数不等和计量单位不同对离散程度测量值的影响,需要计算离散程度的相对指标,即离散系数。 发挥比较稳定的运动员是塞尔维亚的亚斯娜·舍卡里奇和中国的郭文珺,发挥不稳定的运动员蒙古的卓格巴德拉赫·蒙赫珠勒和波兰的莱万多夫斯卡·萨贡 2.3数据标准化 标准化数值是变量值与其平均数的离差除以标准差后的值,也称为z分数或标准分数。设标准化数值为z,则有: 2.4总方差、组内方差和组间方差 组内方差 组间方差 总方差 三、数据分布的形状—偏态与峰态 扁平分布 尖峰分布 偏态 峰态 左偏分布 右偏分布 与标准正态分布比较! 矩的概念 矩,来源于物理学中的“力矩”,等于力(N)x力臂(M)。 1.原点矩:以标志位0点位原点或支点,以各组的标志位 值为力臂,以 为作用力的大小。 一阶原点矩 k阶中心矩 偏态 统计学家Pearson于1895年首次提出。是指数据分布的不对称性 测度统计量是偏态系数(coefficient of skewness) 偏态系数=0为对称分布;0为右偏分布;0为左偏分布 偏态系数大于1或小于-1,为高度偏态分布;偏态系数在0.5~1或-1~-0.5
文档评论(0)