统计学专业课程第一章作业资料.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
| 第一章 描述性统计 1. 某生产车间50名工人日加工零件数如下(单位:个)。试在minitabe下画直方图,并分析数据特征。 117 122 124 129 139 107 117 130 122 125 108 131 125 117 122 133 126 122 118 108 110 118 123 126 133 134 127 123 118 112 112 134 127 123 119 113 120 123 127 135 137 114 120 128 124 115 139 128 124 121 1.给数据排序2.拿数据最大值减最小值,确定组数 3.由于组距一般为5或10,因此确定组距为5 4.计算频数 5.绘制直方图,再编辑横轴和纵轴的区间。 数据特征:大多数人的日加工零件数在120到125之间。 2. 为了了解车间加工零件误差与原材料供应商以及工人的关系,收集如下数据,试画多元箱线图展示该数据并进行分析 原材料供应商 员工编号 1 2 3 4 5 6 7 甲 0.379 0.331 0.259 0.233 0.223 0.289 0.396 甲 0.400 0.305 0.277 0.231 0.434 0.475 0.329 乙 0.267 0.325 0.299 0.372 0.157 0.257 0.399 乙 0.098 0.617 0.236 0.219 0.305 0.212 0.334 丙 0.266 0.451 0.304 0.423 0.274 0.299 0.173 丙 0.299 0.546 0.392 0.434 0.312 0.318 0.218 丁 0.122 0.342 0.176 0.242 0.427 0.265 0.136 丁 0.248 0.258 0.269 0.172 0.303 0.390 0.034 由原材料供应商的箱线图可知,原材料供应商的数据比较集中,差距不大,但从工人的箱线图看出,工人的数据起伏波动较大,尤其是工人2的数据,跟其他工人的数据相比有很大的差异,因此原材料供应商对加工零部件误差的影响要小于工人对加工零部件的影响。 3. 甲乙两个班各有40名学生,期末统计学考试成绩的分布如下: 考试成绩 人数 甲班 乙班 优 3 6 良 6 15 中 18 9 及格 9 8 不及格 4 2 (1)根据上面的数据,在Excel中画出两个班考试成绩的复合柱形图、环形图和图饼图。 (2)比较两个班考试成绩分布的特点。 (3)在Excel中画出雷达图,比较两个班考试成绩的分布是否相似。 (1) (2)从上面的图标可以看出,甲班同学的考试成绩主要分布在中,乙班同学的考试成绩主要分布在良。甲班的不及格人数比乙班的不及格人数多。 (3) 从上图可知,甲乙两班考试成绩的分布不相似。 4. 随机抽取25个网络用户,得到他们的年龄数据(单位:周岁)如下: 网民年龄 15 16 17 18 19 19 19 20 20 21 22 22 23 23 23 24 24 25 27 29 30 31 34 38 (1) 计算众数、中位数。(exlce数据分析:众数19,中位数22.5) (2) 根据定义公式计算四分位数(上四分位数的位置为3(24+1)/4=18.75,所以上四分位数是26.5,下四分位数的位置是(24+1)/4=6.25,所以下四分位数是19)。 (3) 计算平均数和标准差(平均数是23.29,标准差是5.75)。 (4) 计算偏态系数和峰态系数(偏态系数是0.93,峰度系数是0.59)。 (5) 对网民年龄的分布特征进行综合分析。(根据以上的分析得出,网民的年龄主要集中在19岁,偏态系数大于0,说明网民的年龄分布呈现右偏分布,即年龄较小的网民占绝大多数,峰态系数大于0,说明网民的年龄分布为尖峰分布,表明年龄较小的网民占较大比重。) 5. 某银行为缩短顾客到银行办理业务等待的时间,准备采用两种排队方式进行试验:一种是所有顾客都进入一个等待队列;另一种是顾客在三个业务窗口处列队三排等待。为比较哪种排队方式使顾客等待的时间更短,两种排队方式各随机抽取的9名顾客,得到第一中排队方式的平均等待时间为7.2分钟,标准差为,1.97分钟,第二种排队方式的等待时间(单位:min)如下: 排队时间 5.5 6.6 6.7 6.8 7.1 7.3 7.4 7.8 7.8 (1) 计算第二种排队方式等待时间的平均数和标准差(平均数是7,标准差是0.71)。 (2) 比较两种排队方式等待时间的离散程度(因为两种排队方式的平均数不同,所以用离散系数进行比较,利用离散系数的计算公式,得第一种排队方式的离散系数0.274,第二种排队方式的离

文档评论(0)

小屁孩 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档