- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
用excel产生随机数
统计软件提供的随机数发生器可以使我们对抽样分布进行计算机模拟,对抽
样分布有更加直观的理解。Excel的分析工具库中有一个“随机数发生器”模块,
可以产生服从大部分常用分布的模拟数据,但没有提供直接产生随机数的函数。
在SPSS中产生随机数的函数在“Randomnumbers”类别中,相应的函数都是以Rv
开头的。
1 样本均值抽样分布的随机模拟
假总体的均值为 ,标准差为 ,则统计理论表明,不论总体的分布如何,
只要样本容量n足够大,样本均值的分布总会趋向于正态分布,且均值为 ,标
准差为 n 。
例题:假设总体为均匀分布,模拟样本均值的抽样分布。
假设总体的分布为0-1区间上的均匀分布,则总体的均值为0.5,方差等于
1/12,标准差等于0.288675。现在,我们从总体中抽取1000个样本容量为2的样
本(有放回抽样),计算每个样本的样本均值,然后观察样本均值的分布状况。
新建一个Excel工作簿,单击“工具” “数据分析” “随机数发生器”,
在弹出的对话框中把变量个数设为2,随机数个数为1000,选择0-1区间的均匀分
布,结果放在新工作表中(图1)。把输出结果的每一行看作一个容量为2的样本,
共有1000个样本。在C列中计算每个样本的均值。接下来我们就可以分析这1000
个样本均值的分布状况了。由于SPSS的直方图工具更为方便,我们把相应的数据
复制到SPSS中作直方图,结果如图2,抽样分布的均值为0.5097,标准差为
0.20345,理论值等于0.288675/ 2 =0.20412,两者差异不大。
图1 随机数发生器对话框
图2 样本均值的抽样分布,样本容量=2
2 样本比例抽样分布的随机模拟
样本比例实质上就是指标数值只能取0和1时的样本均值。由于在这种情况下
总体的分布为0-1分布,因此在重复抽样的条件下样本均值抽样分布的理论分布
是二项分布。中心极限定理表明当样本用量足够大(能够保证np≥5,nq≥5)时
二项分布可以用正态分布来近似。
[例] 假设有大批零件,不合格率p为0.2。随机模拟从总体中抽取样本容量
p
分别为5,20,50的2000个样本,分析样本比例 ˆ 的抽样分布。
新建一个工作表,在单元格中输入图5-10左上角所示的信息作为总体:总体
中取值为1 (不合格)的概率为0.2,取值为0 (合格)的概率为0.8。
图3 二项分布的随机模拟
使用Excel的随机数发生器,在分布中选择“离散”,数值与概率区域选为
$A$1:$B$2,变量个数设为5,随机数设为2000 (图3)。在输出数据中,把每一
行看作一个随机样本,计算样本比例(均值)。在SPSS中作样本比例抽样分布的
直方图,如图4。
图4 样本比例的抽样分布,样本容量=5
这是百度知道一位同学的提问。要求生成范围为 1 到50 的随机整数,并且,1
-15 的机率为50%,16-36 的机率为30%,37-50 的机率为20%。同时还要求
生成500 组,每组8 个。
我当时给出一个公式:
=if(rand()0.5,round(rand()*14,0)+1,if(rand()0.6,round(rand()*20,0)+
16,round(rand()*13,0)+37))
这里说下用round 和用int 的区别,用int 生成16-36 的随机数的话应该用
int(rand()*21+16),而用round 可用round(rand()*20+16),这后面的+16 放括
号里面外面都一样,因为取整操作是由小数部分决定的。
还有我第二个if 的判断用的是rand()0.6 而不是小于0.3,这是因为第二个if
会执行的机率是50%,50%乘以0.6 就是30%。
后来楼主同学又出怪招,要求每组无重复数字,每组从小到大排列。
这个只用单纯的公式的话不好办了。
文档评论(0)