网站大量收购独家精品文档，联系QQ：2885784924

修正调研数据扩展使用限度.doc

下载文档

1
0
约2.45千字
约 6页
2018-05-27 发布于河南
举报
版权申诉
保障服务

修正调研数据扩展使用限度.doc

1、本文档共6页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

查看更多

修正调研数据扩展使用限度

HYPERLINK /blog/2010/07/02/weight2/ \o 修正调研数据扩展使用限度（下）修正调研数据扩展使用限度（下） 2010年07月02日 | HYPERLINK /blog/category/user_research/ 用户研究如何加权——单变量比例加权为了比较初级买家与高级买家之间对某一产品的体验差异，采用非等比随机抽样，事先增加了高级买家的抽中比例。 ? 当需要推及总体买家对这一产品的体验情况时，需要对数据进行加权，结果如下：上表第d列 (S/P) 是用各级别买家在调研样本中占的比例除以其在总体中占的比例，其值越接近1，说明该级别买家在调研样本中的比重越合适；反之，其值越背离1，其在调研样本中的比重越不合适。若恰巧各组的这一比值均接近1，可以近似等同总体分布，而不对调研样本进行加权。本例显然需要对调研样本进行加权。首先要确定加权的起点在哪里？这里有三种选择： 1）以S/P的最小值（本例0.69）为起点，将其他组的S/P值都降低到这个水平，因此叫做Scale-down weighting（“水落石出”法）。其结果是将原调研样本缩小S/P最小值倍（本例0.69，原调研样本7200人，每组权重为0.69/d列相应值，加权后减至4968)，放水过多，不合适 2）以S/P的最大值（如本例的8.33）为起点，将其他组的S/P值都提高到这个水平，这种策略叫做Scale-up weighting（“水高船涨”法）。其结果也就是将原来的调研样本放大S/P最大值倍（本例8.33倍，原调研样本7200人，每组权重为8.33/d列相应值，加权后会增至59976人），可见水分太大，不可取。 3）以S/P的加权平均值为起点，将大于1的S/P值调低至1而将小于1的S/P值调高至1，因此叫做Zero-sum weighting（“有增有减但总数不变”法）。加权后的样本数与原调研样本相同、还是7200（见表第f列）。可见这种方法相比之下最合理，学术界和调查业界通常都用它来加权。 ? ?? 比例加权需要注意的几个问题： 1）加权只能调整样本各组之间的相对比例、并不会产生任何新的信息。 2）一个重要细节是如果S/P值中有小于0.5（也即P/S值或权数大于2）的，则不能靠过分灌水来解决问题。这时的对策有三个： ? 增加那些采样不足的（under-sampled）组别的case数量（上策） ? 用S/P值最小值（Scale-down的策略）来加权（最保守、浪费资源、但不犯I类错误） ? 前两者的结合，即增加部分case数然后按新的最小S/P值来加权 3）如果那些采样不足的（under-sampled）组case数量太少（一般不能少于30），需要按2）同样的原则来处理。对于2）和3）中提到的情况，另外一种变通的方法就是重新划分组，此法省时省力。 4）经过加权的样本，能够推算总体的常规统计量，但计算误差时则不能用加权样本直接计算。 5）为了便于解释，上述例子只涉及一个变量（买家级别）的加权。实际上，研究买家除了级别，注册时长、月成交量/额等也很重要。所以需要用多个变量同时加权 (weighted by several variables simultaneously）。（本小节以上内容参考了香港城市大学祝建华博士的BLOG文章《 HYPERLINK /post.2695611.html 如何对样本进行加权？》 HYPERLINK /post.2695611.html /post.2695611.html，在此表示感谢，愿祝老师健康、笔耕不辍！） ? 总结一句话：在随机抽样的前提下，比例加权的本质就是将调研样本分布修正为等比随机抽样分布。 ? 如何加权——单变量推及量加权为什么用推及量加权： 1）上小节提到的获取总体参数的变通方法：在总体中用简单随机抽样抽取一定数量的样本，能够获得一个较大的样本，用来推及总体依然带有少许误差。用加权处理的调研样本推及这个大样本群体的行为和态度更为恰当，有时候需要直观的知道这个大样本群体中每种划分的组内有多少人。 2）比例加权的运算方法有些麻烦；而推及量加权的运算方法简便。 ? 推及量加权的依据： 1）加权的前提与比例加权相同：修正非等比随机抽样NPPS和等比随机抽样PPS 2）两种方法等价：比例加权：Pn%/Sn% 推及量加权：Pn/Sn=(Pn%*P)/(Sn%*S)=(Pn%/Sn%)*P/S 由于每一组case相对于比例加权都扩大了P/S倍，即每一个样本都扩大了P/S倍。绝大部分研究结果都以比例呈现，而计算比例的时候，每一个样本扩大的P/S倍没有影响，因此推及量加权适用。 ? 推及量加权需要注意的事项与比例加权相似，此不赘

您可能关注的文档

最近下载

文档评论（0）

xy88118 + 关注: 实名认证

内容提供者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

相关文档

版权处理: 版权声明; 侵权处理; 免责声明; 致被侵权者一封信; 网站诺言

使用帮助: 用户协议; 隐私政策; 上传下载; 投稿帮助; 文档保障服务承诺

文赚学院: 文赚入门; 工具技巧; 官方动态; 文档分析

关于: 关于网站; 联系我们; 企业文化; 公司优势; 寻找合作

更多: 机构入驻; 内容整治报告; 原创力公益; 版权公示; 处罚记录; 分享赚钱

: 原创力文档APP下载

: 关注微信公众号

原创力文档从2008开站以来，已有超数十万网友上传了数亿文档，原创力文档定位于“知识资源平台、知识服务平台”；本网站为内容提供方提供“创作营收”解决方案：你只需要简单地上传及管理你的内容，而后续的宣传/推广/内容分发/售出下发/发票开具/知识增值创收都由我们完成，让你无后顾之忧！本网站所有资料为用户分享上传，若发现您的权利被侵害，请联系24小时智能客服，如遇紧急情况请联系侵权客服QQ：2885784724（客服上班时间为9:00-18:30）；若您有其他疑问或建议，可点击此处联系我们，上传者QQ群:751299218

公安局备案号:51011502000106|工信部备案号:蜀ICP备08101938号-1|ICP经营许可证/EDI许可证:川B2-20180569|公司营业执照|出版物经营许可证:成新出发高新字第046号|网信算备:510107145616301250011号
© 2010-2025 max.book118.com 原创力文档. All Rights Reserved 四川文动网络科技有限公司违法与不良信息举报电话：18582317992