统计数字会说谎.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计数字会说谎

统计数字会说谎 摘要: 在我们的工作、生活中 ,经常能接触到各种各样的数据、调 结果 ,这些数据和结果都 是正确的吗 ?哪些数据有误导性 ?哪些数据有限定条件 ?哪些数据不可以比较 ?本次分享告 诉大家如何解读数据 ,如何看透数据的真相 ! 在我们的工作、生活中 ,经常能接触到各种各样的数据、调 结果 ,这些数据和结果都是正确的吗 ?哪些数据有误导性 ?哪些数据有限定条件 ?哪些数据不可以比较 ?本次分享告诉大家如何解读 数据 ,如何看透数据的真相 ! 【案例一】样本的代表性 1936年 《青年文摘》对美国总统大选的结果进行预测 ,结果失败 ,问题出在调 方法上 (调 对象 是其读者 ,调 方法为电话调 )。1936年有能力购买电 话和订阅杂志的人并不能代表所有的 选民 ,至少在经济上 ,他们是一个极其特殊的群体 ,是有偏的 ,事实后来证实他们有许多人是共和 党的选民。但是如果调 选择 的样本是代表性的 ,能代表全部选民那么调 就能得到准确的预测 结果。 盖洛普为什么预测美国大选的结果很准确 ?他们采用抽样调 方法 ,在全国各州按比例选择调 对 象对总体有很强的代表性 。 【案例二】样本量是否足够 ? 我们来调 “喜欢大番茄的人多还是小番茄的人多” ,究竟调 10个人、20个人还是100个人得出的结 论是准确的呢 ?我们选择多少个人作为调 对象 ,即需 要多少个样本量的决定因素有很多 ,总体的 大小 ,总体内部的变异程度等等。总体的大小很容易理解 ,调 全市市民和调 一个班级哪个需要 的样本量大呢 ?显然是 前者。至于总体内部的变异程度 ,举个例子 ,如果总体只有100个人且 这100个人差异不大 ,或许十几个样本就已经足够了 ,但是如果这100个人每个人差异 性都很大呢 ?是不是要选取更多的样本才能更真实反映100个人的情况呢 ? 举一个用研的例子 :对于整个淘宝网买家的调研 ,基本上我们要保障1500的样本量 ,而对于某一类 目卖家的调研可能几百就足够了 (比如机票等类目卖家较少 )。 PS :抽样经验 :1500以上的样本量基本就能很好地代表总体 ,无论总体有多大。 【案例三】敏感、隐私话题 对于一些敏感、隐私的话题 ,被调 者对于你的提问可能不会反映最真实的情况。如果采纳这些不 真实的信息 ,会使得调 结果不准确 ,比如图中询问“您更喜欢阅 读哪本杂志 ?” ,可能有很多人明 明更喜欢阅读 《东周刊》却选择 《凤凰周刊》 ,原因在于担心选择前者可能会被大家认为是一个喜 欢偷窥隐私的人。因此对于敏感 隐私的话题 ,不必面对面调 ,可以采用集体填答问卷的形式或者 电话调 的方式 ,并且说明我们的保密原则 ,结果就会好很多。另外有些隐私话题不用直接询问 , 可以从不同角度确认这些信息 ,例如询问“每月您的消费支出水平” ,我们可以通过询问“购买哪些品 牌的衣服”“经常去哪儿就餐”等问题从侧面收集资料。 【案例四】平均数的陷 假设你是某个小型制造企业的3个合伙人之一 ,到了月底给企业的90个职工发了99000元 ,你和合 伙人每人共获得5500元的工资 ,最后还余下21000 元作为利润可供你们3个合伙人平分。你会选择 哪一种表述公示呢 ? 肯定是后者 ,因为显得收入分配更公平 ,但其实每个人拿到的钱还是和前者 一样。因此需要特别注意这些平均数背后的真相。 国家统计局发布 《2009年国民经济和社会发展统计公报》 ,其中称“70个大中城市房屋销售价格上 涨1.5%” ,数字公布之后 ,引起了代表委员和社会舆论的广泛质疑。从数字看起来房价上涨很少 , 但为何与我们的感受不一致 ,主要原因还是在于平均数 ,这一数字对房屋种类、地区、地段、楼层 、朝向、时点等因素而差异较大的样本进行综合平均统计 ,过度消除了价格变化。 统计局公布1月CPI数字 ,因为春节假期央行再度加息 ,市场曾预期1月CPI必将再创新高 ,甚至有望 接近6%数字 ,可实际数字4 .9%却让人颇为意外。原 因就是统计局CPI统计的新权重 :居住类、医疗 保健类、娱乐教育文化类价格权重上升 ,食品类权重下降。而食品类价格却是百姓感受最明显的一 个指标 ,因此平 均时权重差异也使得我们感受与数字之间产生差异。 【案例五】一样的数据 ,不一样的图形 为了让没有直接接触数据的人也能直观地感受到其中的一些信息 ,人们发明了各种各样漂亮的统计 图表。但是就是“客观”的图表里面也存在着各种各样的陷阱。在制作统计图表时 ,一个常用的欺骗手 法便是改变统计图形的坐标尺度 ,从而改变了整个图形的增长趋势或是

文档评论(0)

ldj215322 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档