- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
好久没有更新博客了,今天更新一篇关于数据分析方法的文章,主要是基于统计学
的假设检验的原理,无论是 T 检验还是卡方检验在现实的工作中都可以被用到,而
且结合 Excel 非常容易上手,基于这类统计学上的显著性检验能够让数据更有说服
力。还是保持一贯的原则,先上方法论再上应用实例,这篇文章主要介绍方法,之
后会有另外一篇文章来专门介绍实际的应用案例。
关于假设检验
假设检验 (Hypothesis Testing ),或者叫做显著性检验 (Significance Testing )
是数理统计学中根据一定假设条件由样本推断总体的一种方法。其基本原理是先对
总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还
是接受作出推断。既然以假设为前提,那么在进行检验前需要提出相应的假设:
H0 :原假设或零假设( null hypothesis ),即需要去验证的假设;一般首先认
定原假设是正确的,然后根据显著性水平选择是接受还是拒绝原假设。
H1 :备择假设( alternative hypothesis ),一般是原假设的否命题;当原假设
被拒绝时,默认接受备择假设。
如原假设是假设总体均值 μ= μ,则备择假设为总体均值 μ≠μ,检验的过程就
0 0
是计算相应的统计量和显著性概率,来验证原假设应该被接受还是拒绝。
T 检验
T 检验( T Test )是最常见的一种假设检验类型,主要验证总体均值间是否存
在显著性差异。 T 检验属于参数假设检验,所以它适用的范围是数值型的数据,在
网站分析中可以是访问数、独立访客数、停留时间等,电子商务的订单数、销售额
等。 T 检验还需要符合一个条件 —— 总体符合正态分布。
这里不介绍 t 统计量是怎么计算的, 基于 t 统计量的显著性概率是怎么查询的,
其实这些计算工具都可以帮我们完成,如果有兴趣可以查阅统计类书籍,里面都会
有相应的介绍。这里介绍的是用 Excel 的数据分析工具来实现 T 检验:
Excel 默认并没有加载 “数据分析 ”工具,所以需要我们自己添加加载项,通过
文件 — 选项 — 加载项 — 勾选 “分析工具库 ”来完成添加, 之后就可以在 “数据 ”标签的最
右方找到数据分析这个按钮了,然后就可以开始做 T 检验了,这里以最常见的配对
样本 t 检验为例, 比较某个电子商务网站在改版前后订单数是否产生了显著性 差异,
以天为单位,抽样改版前后各 10 天的数据进行比较:
改版前订单数 改版后订单数
1 1032 1187
2 1178 1245
3 1098 1379
4 1045 1094
5 976 1173
6 1101 1364
7 1276 1119
8 1215 1268
9 987 1303
10 1065 1274
首先建立假设:
H0 μ μ
: 1 = 2 ,改版前后每天订单数均值相等;
1 2
H1 : μ≠μ,改版前后每天订单数均值不相等。
将数据输入 Excel ,使用 Excel 的数据分析工具,选择 “t检验:平均值的成对
二样本分析 ”,输出检验结果:
看到右侧显示的结果是不是有点晕了,看上去有点专业,其实也并不难,只要
关注一个数值的大小 —— 单尾的 P 值,这里是 0.00565 ,如果需要验证在 95% 的置
信水平下的显著性,那么
文档评论(0)