- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
1
。《数据科学统计计算》课后习题答案
。
统计计算第一章课后题
1.Pareto(a,b)分布具有累积分布函数:
, x≥b0,a0. (1)
请利用逆变换法模拟αa=2,b=2 的 Pareto 分布随机样本。并尝试通过在分布密度曲线图上
同时绘制样本密度直方图比较模拟效果。
解答:密度函数满足以下两个条件:(1)存在反函数,(2)原函数在定义域上是连续单调递
增的,通过计算反函数为
set.seed(1)
n- 100
eta-NULL
i- 1
a-2
b-2
while(i=n){
r-runif(1,0,1)
p-exp((a*log(b)-log(1-r))/a)
eta[i]-p
i=i+1
hist(eta ,30,freq=F,main=Pareto(2,2),ylim=c(0,1))
x0-seq(min(eta),max(eta),0.001)
fx-a*b^a/(x0^(a+1))
lines(x0,fx,col=2)
2.生成一个大小1000、服从正态位置混合变量的随机样本,混合变量的分量分别服从N(0,1)
分布和N(3,1) 分布,混合密度分别为pi=p?=0.5 。 请绘制叠加密度曲线的样本直方图。
解答:首先生成符合U(0,1) 的随机数ui,如果u;Pi, 则生成N(0,1) 的随机数,否则生成
N(3,1) 的随机数
set.seed(123)
n- 1000
2
i- 1
i- 1
p-0.5
eta-NULL
while(i=n){
u-runif(1,0,1)
if(up){
eta[i]-rmorm(1,0,1)
else{
eta[i]-rmorm(1,3,1)
}
i=i+1
hist(eta,freq=F,main=0.5N(0,1)+0.5N(3,1))
x0-seq(min(eta),max(eta),0.001)
fx-p*dnorm(x0,0,1)+(1-p)*dnorm(x0,3,1)
lines(x0,fx,col=2)
3.Rayleigh 分布具有密度函数:
(2)
请设计多种能够生成上述分布的算法。取σ=1,尝试通过直方图与密度曲线图比较效果。
解答:(1)逆变换抽样法:对原概率密度函数
求分布函数可得
该函数在x0 连续并且严格单调递增的,可以使用逆变换抽样法。先求F(x) 反函数可得
→ x=√-2o-2ln(1-y).
n- 10000# 生成10000个随机数
sigma=1
r-matrix(runif(n,0,1),n,1)#生成均匀分布随机数$
x-sqrt(-2*sigma^2*log(1-r))# 反函数
x0=seq(0,4,0.01)
fx=x0/(sigma^2)*exp(-x0^2/(2*sigma^2))#原概率密度函数
hist(x,20,freq =F,main=Rayleigh(1))
lines(x0,fx,1,col=2)
3
(2)变换抽样法:首先证明,对于参数为σ的Rayleigh 分布,可以看作两个互相独立正态
随机变量X?,X2~N(0,σ2) 求平方和后开根号,即:
根据 X,X? 概率密度函数
i=1,2,
由于两个随机变量独立,所以(X?,X?) 联合概率密度函数为
则Y 的分布函数为:
(3)
n- 10000
i- 1
sigma- 1
eta-NULL
while(i=n){
set.seed(i)
x1-rmorm(1,0,1)
x2-rnorm(1,0,1)
eta[i]-sqrt(x1^2+x2^2)
i=i+1
}
hist(eta,20,freq =F,main=Rayleigh(1),ylim =c(0,0.8))
x0-seq(min(eta),max(eta),0.01)
fx-x0*exp(-x0^2/2)
lines(x0,fx,col=2)
4.离散随机变量X 服从下述分布:
X
0
1
2
3
4
p(x)
0.1
0.2
0.2
0.2
0.3
设计算法生成样本量为1000、服从上述分布的随机数。并且比较随机数的观测频率和理论
概率值。
4
解答:首先产生均匀分布的随机数R~U(0,1), 分布的随机变量ξ可以由下式生成:
pl=0. 1;
p2=0.2;
p3=0.2;
p4=0.2:
p5=0.3;
y=NULL
set.seed(444)
for(i in 1:n)
x=runif(1)
if(xpl)y[i]=
原创力文档


文档评论(0)