统计数字会说谎.pdfVIP

下载本文档

226
0
约3.67千字
约 9页
2017-07-29 发布于江苏
举报
版权申诉

统计数字会说谎.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

统计数字会说谎

统计数字会说谎摘要: 在我们的工作、生活中，经常能接触到各种各样的数据、调结果，这些数据和结果都是正确的吗？哪些数据有误导性？哪些数据有限定条件？哪些数据不可以比较？本次分享告诉大家如何解读数据，如何看透数据的真相！在我们的工作、生活中，经常能接触到各种各样的数据、调结果，这些数据和结果都是正确的吗？哪些数据有误导性？哪些数据有限定条件？哪些数据不可以比较？本次分享告诉大家如何解读数据，如何看透数据的真相！【案例一】样本的代表性 1936年《青年文摘》对美国总统大选的结果进行预测，结果失败，问题出在调方法上（调对象是其读者，调方法为电话调）。1936年有能力购买电话和订阅杂志的人并不能代表所有的选民，至少在经济上，他们是一个极其特殊的群体，是有偏的，事实后来证实他们有许多人是共和党的选民。但是如果调选择的样本是代表性的，能代表全部选民那么调就能得到准确的预测结果。盖洛普为什么预测美国大选的结果很准确？他们采用抽样调方法，在全国各州按比例选择调对象对总体有很强的代表性。【案例二】样本量是否足够？我们来调 “喜欢大番茄的人多还是小番茄的人多” ，究竟调 10个人、20个人还是100个人得出的结论是准确的呢？我们选择多少个人作为调对象，即需要多少个样本量的决定因素有很多，总体的大小，总体内部的变异程度等等。总体的大小很容易理解，调全市市民和调一个班级哪个需要的样本量大呢？显然是前者。至于总体内部的变异程度，举个例子，如果总体只有100个人且这100个人差异不大，或许十几个样本就已经足够了，但是如果这100个人每个人差异性都很大呢？是不是要选取更多的样本才能更真实反映100个人的情况呢？举一个用研的例子：对于整个淘宝网买家的调研，基本上我们要保障1500的样本量，而对于某一类目卖家的调研可能几百就足够了（比如机票等类目卖家较少）。 PS ：抽样经验：1500以上的样本量基本就能很好地代表总体，无论总体有多大。【案例三】敏感、隐私话题对于一些敏感、隐私的话题，被调者对于你的提问可能不会反映最真实的情况。如果采纳这些不真实的信息，会使得调结果不准确，比如图中询问“您更喜欢阅读哪本杂志？” ，可能有很多人明明更喜欢阅读《东周刊》却选择《凤凰周刊》，原因在于担心选择前者可能会被大家认为是一个喜欢偷窥隐私的人。因此对于敏感隐私的话题，不必面对面调，可以采用集体填答问卷的形式或者电话调的方式，并且说明我们的保密原则，结果就会好很多。另外有些隐私话题不用直接询问，可以从不同角度确认这些信息，例如询问“每月您的消费支出水平” ，我们可以通过询问“购买哪些品牌的衣服”“经常去哪儿就餐”等问题从侧面收集资料。【案例四】平均数的陷假设你是某个小型制造企业的3个合伙人之一，到了月底给企业的90个职工发了99000元，你和合伙人每人共获得5500元的工资，最后还余下21000 元作为利润可供你们3个合伙人平分。你会选择哪一种表述公示呢？肯定是后者，因为显得收入分配更公平，但其实每个人拿到的钱还是和前者一样。因此需要特别注意这些平均数背后的真相。国家统计局发布《2009年国民经济和社会发展统计公报》，其中称“70个大中城市房屋销售价格上涨1.5％” ，数字公布之后，引起了代表委员和社会舆论的广泛质疑。从数字看起来房价上涨很少，但为何与我们的感受不一致，主要原因还是在于平均数，这一数字对房屋种类、地区、地段、楼层、朝向、时点等因素而差异较大的样本进行综合平均统计，过度消除了价格变化。统计局公布1月CPI数字，因为春节假期央行再度加息，市场曾预期1月CPI必将再创新高，甚至有望接近6%数字，可实际数字4 .9%却让人颇为意外。原因就是统计局CPI统计的新权重：居住类、医疗保健类、娱乐教育文化类价格权重上升，食品类权重下降。而食品类价格却是百姓感受最明显的一个指标，因此平均时权重差异也使得我们感受与数字之间产生差异。【案例五】一样的数据，不一样的图形为了让没有直接接触数据的人也能直观地感受到其中的一些信息，人们发明了各种各样漂亮的统计图表。但是就是“客观”的图表里面也存在着各种各样的陷阱。在制作统计图表时，一个常用的欺骗手法便是改变统计图形的坐标尺度，从而改变了整个图形的增长趋势或是