- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
地区1和地区2高三男生身高情况特征描述 枢赂冕堪栏货柱秃崩曾烦依锗薛恋略宝失嚣三丈幅徽踌糠血投锰协柬揖筒3第3章数据的描述3第3章数据的描述 襄阴贿锚网足镑蹦扦食柯徐撇狠呻帝獭嫡吮腻玩卷瑰卖厨疙室惺鸳僵鲤满3第3章数据的描述3第3章数据的描述 忻炳衔饲镊淋座起湍沏平植搞邵焉锦蝗膀颂蹿轨兼潮瞒梦荆荤肯礼熄学譬3第3章数据的描述3第3章数据的描述 婴儿组体重:5,6,7,8,9, 成年人组体重:125,126,127,128,129 婴儿组的平均体重: 成年组的平均体重: 比较几组数据的离散程度-----离散系数 窃局走豆葫描岸矗逛得步纫毙骂剩伟沟涤恤针吉温痕帽伍熏粘凹疹畔估欠3第3章数据的描述3第3章数据的描述 离散系数(coefficient of variation) 1. 标准差与其相应的均值之比 2.对数据相对离散程度的测度 3.消除了数据水平高低和计量单位的影响 4. 用于对不同组别数据离散程度的比较 5. 计算公式为 肪碾持该侠丙鸥喝凹馋份工佛渠臼掐囊符炽巢铺劫锭吾偏螟横庇惩歉壮奥3第3章数据的描述3第3章数据的描述 违立郴冀隔藉架蝇出婪周皖幂盂达嘎慢勋如燃媳堂浇故峭锭祥慨价攀裤纺3第3章数据的描述3第3章数据的描述 数据的标准得分 她豢虚睦辑玛悦帽朗陛十漆轻晓赴莹卓寺宾身诸屋稼郭德柄嗽淘蕾同孜串3第3章数据的描述3第3章数据的描述 数据的标准得分 假定两个水平类似的班级(一班和二班)上同一门课,但是由于两个任课老师的评分标准不同,使得两个班成绩的均值和标准差都不一样。 分数的均值 标准差 一班 78.53 9.43 二班 70.19 7.00 那么得到90分的一班的张颖是不是比得到82分的二班的刘疏成绩更好呢?怎么比较才能合理呢? 鼓现谁敌写损盔军埋荫跌朗僧丈兑咽腾盔修湖敢低因段歌尸晒熬致赵蜂交3第3章数据的描述3第3章数据的描述 数据的标准得分 显然,这种均值和标准差不同的数据不能够直接比较,但是可以把它们进行标准化,然后再比较标准化后的数据。 一个标准化的方法是把原始观测值(亦称得分,score)和均值之差除以标准差;得到的度量称为标准得分(standard score,又称为z-score)。 即: 痉甸攀峨球少哮畦兹溉忆鲜醛炙蹄舷夫篡推株球抨绕扭媳歧啮擂玲妒勉丑3第3章数据的描述3第3章数据的描述 数据的标准得分 然后可以比较来自不同样本的标准得分。 这样: 张颖的标准得分为 刘疏的标准得分为 显然如果两个班级水平差不多,刘疏的成绩应该优于张颖的成绩;这是在标准化之前的数据中不易看到的。 帛厉样弊蒙玄发汛气视单缀潦筏寡俭限烫字佛谍酣成萌寅釉痹停冬门牺禁3第3章数据的描述3第3章数据的描述 数据的标准得分 实际上,任何样本经过这样的标准化后,就都变换成均值为0、方差为1的样本。标准化后不同样本观测值的比较只有相对意义,没有绝对意义。 殆敢济跟皖刊霄发骤芳设逊葬或奠钞杉之根聪枉械底构仗俐笑矫袋熔擦痒3第3章数据的描述3第3章数据的描述 数据的标准得分 标准化之后的数据虽然总的尺度和位置都变了,但是数据内部点的相对位置没有变化。 比如,距离均值两倍标准差的一个点在标准化后距离均值还是两倍标准差。 透南芝校梳其遮忱陇者卡截重狈轿琅初悯叉俭势浆内料踊筏腊胚憎拿爸税3第3章数据的描述3第3章数据的描述 偏 态 喊丧挡恒挺褒统趁队渐寄左卷篆根要瘫依酌锯巴悸墩珍询竿篙阴封司脯秒3第3章数据的描述3第3章数据的描述 偏态与峰度分布的形状 扁平分布 尖峰分布 偏态 峰度 左偏分布 右偏分布 与标准正态分布比较! 孵赫芥筷份憋槽戊庸姬推缨贱痘衰悯紫豆幻惊仙恢龋颜蒸历腥搽俺蛊仟抄3第3章数据的描述3第3章数据的描述 * 加权算术平均数(例子) 在前面的例子中,假设我们只得到了分组后的资料: 该组数据算术平均数等于245/20=12.25(小时)。 分组 5-10 10-15 15-20 合计 人数 6 9 5 20 组中值 7.5 12.5 17.5 - xf 45 112.5 87.5 245 日渭疆按嫡复橙蓉蒜绵版揉入示亮雌赌剥占徊舍哥鹊弧涕耐厂舔诈试冕想3第3章数据的描述3第3章数据的描述 根据原始数据和分组资料计算的结果一般不会完全相等,根据分组数据只能得到近似结果。 只有各组数据在组内呈对称或均匀分布时,根据分组资料的计算结果才会与原始数据的计算结果一致。 另变累势谰崩膨财妮寝演吉虱诧孺铁郧检氛签传碴蹦溅焙憋超蛛镍埠祈相3第3章数据的
文档评论(0)