- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第五节 EXCEL在统计描述中的运用
一、编制分布数列
【例3-19】某地区进行农产量抽样调查,抽取50个单位构成样本。样本资料如下:
亩产量数据 单位:公斤
240 440 400 375 500 528 412 425 320 400 520 600 485 600 588 412 444 430 342 364 450 455 465 500 580 345 340 320 300 403 445 360 517 390 410 360 422 428 520 400 425 385 440 380 548 304 448 605 325 500 要求(1)编制次数分布数列(组距为100,进行等距分组),并绘制次数分布图;(2)分别向上累计和向下累计并绘制累计分布图。
解:本例可用[直方图]分析工具或FREQUENCY等函数来完成。但[直方图]工具不能直接进行向下累计,需要借助Excel公式才可进行。
(一)用[直方图]工具进行分析。
直方图工具,用于在给定工作表中数据单元格区域和接收区间的情况下,计算数据的个别和累积频率,可以统计有限集中某个数值元素的出现次数。
主要步骤如下:
1.输入数据。如图3-15所示,A列输入亩产量,A1为列标志“亩产量”,C列为分组标志,B2:B7为分组组限,B1为列标志“组限”。在确定组限时,需要注意:(1)组限指的是某一组的上限,如299.9是300以下(也即200-300)这一组的上限,399.9是300-400这一组的上限。(2)对未排序的亩产量数据,可先用MAX与MIN函数确定亩产量的最大与最小值,以方便确定组限。(3)[直方图]工具分组时采用的是“上限在内”原则,为符合统计分组的“上限不在内”原的则,每个组限均不应与亩产量相同。如本例中组限399.9表示将统计出亩产量大于299.9而小于等于399.9的数据点个数,如果亩产量中有399.9这个数,则可将300-400这一组的上限上为399.99。
2.调出[直方图]对话框,其主要选项的含义如下。
输入区域:在此输入待分析数据区域的单元格范围。本例输入区域为“$A$1:$A$51”。
接收区域(可选):在此输入接收区域的单元格范围,该区域应包含一组可选的用来计算频数的边界值。这些值应当按升序排列。只要存在的话,Excel将统计在当前边界点和相邻的高值边界点之间的数据点个数。如果某个数值等于或小于某个边界值,则该值将被归到以该边界值为上限的区间中(注意:与统计分组“上限不在内”原则有所区别)。如果省略此处的接收区域,Excel将在数据组的最小值和最大值之间创建一组平滑分布的接收区间。本例接收区域为“$B$1:$B$6”。
图3-14
标志:如果输入区域的第一行或第一列中包含标志项,则选中此复选框;如果输入区域没有标志项,则清除此该复选框,Excel将在输出表中生成适宜的数据标志。
柏拉图:选中此复选框,可以在输出表中同时显示按降序排列频率数据。如果此复选框被清除,Excel将只按升序来排列数据。
累积百分比:选中此复选框,可以在输出结果中添加一列累积百分比数值,并同时在直方图表中添加累积百分比折线。如果清除此选项,则会省略以上结果。
图表输出:选中此复选框,可以在输出表中同时生成一个嵌入式直方图表。
本例[直方图]对话框的填写如图3-14所示。
3.单击[确定]按钮即可。完整的结果通常包括三列和一个频率分布图,第一列是数值的区间范围,第二列是数值分布的频数,第三列是频数分布的累积百分比。在输出的结果中,“频率”指的是统计中所指的“频数”,“累积%”指的是“向上累计频率”。结果中原本还有一“其它”行的数据,该行是亩产量大于699.9的频数与累计频率(位于单元格区域D7:F7),因本例中没有大于699.9的数据,所以可将该行删除,即选定D7:F7,然后执行菜单命令[编辑]([删除]命令。由于该工具总会自动统计出大于最大组限的数据的频数,所以本例中组限也可以不使用699.9,即在第2步中接收区域为“$B$1:$B$6”,在输出的结果中,将“其它”更改为我们所需要的标志性文字,如改为“699.9”。经过修改的结果如图3-15所示。
图3-15
4.计算向下累计频率。在G1单元格输入列标志“向下累计”。在G6单元格输入“=E6/SUM($E$2:$E$6)”,计算出最后一组的频率,在G5单元格中输入“=E5/SUM($E$2:$E$6)+G6”得到最后一组和倒数第二组的累计频率,将G5单元格的公式复制到G2:G4,计算出向下累计这一列。
5.在图表中加入向下累计曲线。选定图表区,此时菜单上出现[数据]按钮变为[图表]按钮,执行菜单命令[图表]([数据源],调出[源数据]对话框。在[源数据]对话框的[系列]页框中
文档评论(0)