- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
随机样本的检验方法是,总体中的每个名字或事物是否有相同的几率被选进样本? 纯随机样本是唯一有足够把握经受统计理论审查的样本,样本选取难度大,成本昂贵。 分层随机抽样是一个更经济的替代品,通过准备好内部所有单位的名单,只调查被随机抽中的单位。 示例4: 1936年,共和党人兰登与当时的总统罗斯福竞选下届总统美国,《文学文摘》(Literary Digest)这家颇有声望的杂志承担了选情预测的任务。此前,它已经成功地预测了5次总统选举的结果。当时采用的是邮寄问卷的办法,调查人员雄心勃勃,从电话号码簿里和本杂志的订户中选取了需要邮寄问卷的对象1000万个,覆盖四分之一的选民。 杂志最终收到了惊人的240万份回执,在统计计算完成以后,它预言兰登将击败寻求连任的罗斯福总统,然而这次调查的结论和实际的结果大相径庭,结果却是罗斯福以压倒多数再次当选。 2. 精心挑选的平均数 The well-chosen average 示例1: “2012年底,城镇和农村人均住房面积32.9平方米、37.1平方米,分别比2007年增加2.8平方米和5.5平方米。” ——温家宝:《政府工作报告》,第十二届全国人大一次会议,2013年3月25日 质疑: “32.9平方米”这个数字表明我国“全面小康”中含金量最大的一块住房小康已经基本实现(主要指标为:到2010年城镇人均住房建筑面积达到30平米,到2020年达到35平米),标志着我国城镇居民的住房问题基本解决。 真相果真如此吗?又被平均了? 这并非“民生话题”,而是一个再简单不过的“算术问题”。让我们来算一算~~ 根据国家统计局2012年度统计年报,到2012年底,“全国大陆总人口为135404万人,其中城镇人口为71182万人”。 71182万乘以人均32.9平方米的住房面积,意味着全国城镇到2012年底拥有的全部住房应该为2341887.8万平方米(约234.2亿平方米)。 然而,根据原建设部公布的2002年底全国城镇存量住宅面积,加上《中国统计年鉴》公布的2003-2012年全国城镇住宅竣工的总面积,可得全国城镇总的住宅总面积为155.49亿平方米。 可知,用官方公布的统计数据计算,城镇人均住房面积仅有21.8平方米,远低于政府工作报告所称的32.9平方米。 何为“平均”? 提问:一条河的平均深度是0.8米,一个小孩身高1.3米,他虽然不会游泳,但肯定不会在这条河里淹死。对吗?为什么? 示例2: 富有的邻居:一个人声称社区居民的年平均收入为15万元,同时另一个人则说社区年平均收入是 3.5万元。两个人都对,为什么? 邻居 年收入(万元) 老张 100 老李 22.5 老王 8 老赵 6 老钱 4 老孙 3 老杨 2 老吴 2 老周 1.5 老郑 1 均值 15万 中位数 3.5万 众数 2万 小结: 三者关系: 平均数(Arithmetic mean)为一个平衡点,是一组数据的重心。它使数轴保持平衡,即支点两侧的力矩是相等的。 中位数(Median)只使其两侧的数据个数相同。 众数(Mode)是指次数出现最多的,重量较大的那个数据。 正态分布的钟型曲线,三个数落在相同点上。 例如人类身高、体型→订制校服 长尾曲线(偏态分布),三种数值相差甚远。 三者比较: 比较的 项目 平均数 中数 众数 适用数据类型 定距、定比 定序、定距、定比 定类、定序、定距、定比 计算 需要所有的数据 只需中间数据 计算迅速 进一步运算特性 可以 不可以 不可以 受抽样的影响 较少 较大 较大 受分组的影响 不大 较大 最大 受极端数据的影响 最严重 最少 一般 适用场合 一般情况都用平均数 ①有极端数据时;②当两端数据或个别数据不清楚时;③快速估计代表值时。 ①有极端数据时;②数据不同质找典型;③快速估计代表值时;④估计分布形态时。 示例3: “截至2011年8月,中国家庭资产平均为121.69万元,城市家庭平均为247.60万元,农村家庭平均为37.70万元。” ——中国家庭金融调查与研究中心:《中国家庭金融调查报告》,2012年 3. 没有披露的数据 The little figures that are not there 示例1: 经科学验证,高露洁360°牙膏能减少口腔细菌滋生,效果最高高出75%*,有效对抗八大口腔问题。 * 数据来自高露洁研究资料。与高露洁普通含氟牙膏相比。 ——高露洁官网 没有披露的数据: 1. 样本容量:10个还是100个? 2. 实验过程:测试对象选取、持续时间? 来做一个小实验: 每人拿出一枚硬币,连续抛10次,记录正面(数字)朝上的次数。 四种可能性: 正面 反面 竖起来 消失了 小结: 数
原创力文档


文档评论(0)