《数据科学统计计算》 课后习题答案汇总 chap 1--chap 6.docxVIP

《数据科学统计计算》 课后习题答案汇总 chap 1--chap 6.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
1 。《数据科学统计计算》课后习题答案 。 统计计算第一章课后题 1.Pareto(a,b)分布具有累积分布函数: , x≥b0,a0. (1) 请利用逆变换法模拟αa=2,b=2 的 Pareto 分布随机样本。并尝试通过在分布密度曲线图上 同时绘制样本密度直方图比较模拟效果。 解答:密度函数满足以下两个条件:(1)存在反函数,(2)原函数在定义域上是连续单调递 增的,通过计算反函数为 set.seed(1) n- 100 eta-NULL i- 1 a-2 b-2 while(i=n){ r-runif(1,0,1) p-exp((a*log(b)-log(1-r))/a) eta[i]-p i=i+1 hist(eta ,30,freq=F,main=Pareto(2,2),ylim=c(0,1)) x0-seq(min(eta),max(eta),0.001) fx-a*b^a/(x0^(a+1)) lines(x0,fx,col=2) 2.生成一个大小1000、服从正态位置混合变量的随机样本,混合变量的分量分别服从N(0,1) 分布和N(3,1) 分布,混合密度分别为pi=p?=0.5 。 请绘制叠加密度曲线的样本直方图。 解答:首先生成符合U(0,1) 的随机数ui,如果u;Pi, 则生成N(0,1) 的随机数,否则生成 N(3,1) 的随机数 set.seed(123) n- 1000 2 i- 1 i- 1 p-0.5 eta-NULL while(i=n){ u-runif(1,0,1) if(up){ eta[i]-rmorm(1,0,1) else{ eta[i]-rmorm(1,3,1) } i=i+1 hist(eta,freq=F,main=0.5N(0,1)+0.5N(3,1)) x0-seq(min(eta),max(eta),0.001) fx-p*dnorm(x0,0,1)+(1-p)*dnorm(x0,3,1) lines(x0,fx,col=2) 3.Rayleigh 分布具有密度函数: (2) 请设计多种能够生成上述分布的算法。取σ=1,尝试通过直方图与密度曲线图比较效果。 解答:(1)逆变换抽样法:对原概率密度函数 求分布函数可得 该函数在x0 连续并且严格单调递增的,可以使用逆变换抽样法。先求F(x) 反函数可得 → x=√-2o-2ln(1-y). n- 10000# 生成10000个随机数 sigma=1 r-matrix(runif(n,0,1),n,1)#生成均匀分布随机数$ x-sqrt(-2*sigma^2*log(1-r))# 反函数 x0=seq(0,4,0.01) fx=x0/(sigma^2)*exp(-x0^2/(2*sigma^2))#原概率密度函数 hist(x,20,freq =F,main=Rayleigh(1)) lines(x0,fx,1,col=2) 3 (2)变换抽样法:首先证明,对于参数为σ的Rayleigh 分布,可以看作两个互相独立正态 随机变量X?,X2~N(0,σ2) 求平方和后开根号,即: 根据 X,X? 概率密度函数 i=1,2, 由于两个随机变量独立,所以(X?,X?) 联合概率密度函数为 则Y 的分布函数为: (3) n- 10000 i- 1 sigma- 1 eta-NULL while(i=n){ set.seed(i) x1-rmorm(1,0,1) x2-rnorm(1,0,1) eta[i]-sqrt(x1^2+x2^2) i=i+1 } hist(eta,20,freq =F,main=Rayleigh(1),ylim =c(0,0.8)) x0-seq(min(eta),max(eta),0.01) fx-x0*exp(-x0^2/2) lines(x0,fx,col=2) 4.离散随机变量X 服从下述分布: X 0 1 2 3 4 p(x) 0.1 0.2 0.2 0.2 0.3 设计算法生成样本量为1000、服从上述分布的随机数。并且比较随机数的观测频率和理论 概率值。 4 解答:首先产生均匀分布的随机数R~U(0,1), 分布的随机变量ξ可以由下式生成: pl=0. 1; p2=0.2; p3=0.2; p4=0.2: p5=0.3; y=NULL set.seed(444) for(i in 1:n) x=runif(1) if(xpl)y[i]=

文档评论(0)

165720323137e88 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档