网站大量收购独家精品文档,联系QQ:2885784924

数据采集与处理 课件 任务6 频数分配及分布类型.pptx

数据采集与处理 课件 任务6 频数分配及分布类型.pptx

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

项目三数据预处理认知

任务6频数分配及分布类型

任务导入:某淘宝店家每天的销售额(元)数据采集,采集50天销售额构成样本,样本资料如下:

任务要求:1.简述编制频数分布的步骤。2.利用Excel对上述某淘宝店日销售额数据进行数据分组,并编制频数分布。

一、频数分配的概念在数据分组的基础上,将数据采集对象的所有单位按组归类整理,并按一定顺序排列,形成数据采集单位在各组间的分布,称为频数分布。(一)频数分布的概念分布在各组的数据采集对象单位数叫次数,也称频数。各组频数之和为总频数。各组频数与总频数之比称为频率(或称为比重、比率)。各组频数与频率可以反映各组标志值水平对数据采集对象标志值水平的影响程度。

一、频数分配的概念将各组的名称与相应的频数或频率,按一定顺序排列起来形成的数列称为频数分布数列,简称频数数列或分布数列。(一)频数分布的概念频数分布数列可以反映数据采集对象单位在各组间的分布状态和分布特征,是进一步分析数据采集对象平均水平和差异程度的基础。

一、频数分配的概念1.品质分配数列(二)频数数列的种类按照品质数据分组而形成的分布数列称为品质分布数列,简称品质数列。某零食网店一段时间购物者性别状况分组表

一、频数分配的概念2.变量数列(二)频数数列的种类按照数值数据分组而形成的分配数列称为变量数列。变量数量又可分为单项式变量数列与组距式变量数列。某地区餐饮业按照营业额分组

二、频数分布的Excel处理Excel上主要利用FREQUENCY函数生成频数分布数列,FREQUENCY函数计算数值在某个区域内的出现频率,然后返回一个垂直数组。语法:FREQUENCY(数据源,分段点)呈现:以分组区间点为间隔,数据源中所有数据在各段出现的频数。注意:1.分组区间点必须设置为每一数据区域中最大的数值(重叠组限应设置为该区域的实际上限);2.最后一组(最大组)可不设置分组区间点,系统会自动查找最后一个分组区间点大的数据的个数作为返回数据组中的最后一个元素,以至于返回数据中的元素个数比分组区间点的个数要多一个。

二、频数分布的Excel处理下面我们以任务导入的案例某淘宝店每天的销售额为例来对数据进行分组并编制频数分布数列。第一步,新建“频数分布.xls”工作簿,建立“某天猫店日销售额”工作表,并在A1:B51区域输入原始数据为数据源,如图所示。

二、频数分布的Excel处理第二步,在单元格C1中输入“按日销售额分组(元)”,在单元格D1中输入“分组区间”,在单元格E1中输入“天数(日)”,如图所示。

二、频数分布的Excel处理第三步,在单元格C2:C6区域中输入“3000元以下”、“3000~4000”、“4000~5000”、“5000~6000”、“6000元以上”;作为分组结果,在D2:D6区域中依次输入相应组的实际上限(即各组的最高销售额):“2999”、“3999”“4999”“5999”,这些数据将作为数据的分组区间在函数中运用。输入后如图所示。

二、频数分布的Excel处理第四步,选中E2:E6区域,然后选择“公式”菜单栏中的“插入函数”按钮,或者单击编辑栏左侧的“插入函数”工具按钮fx,弹出“插入函数”对话框,如图所示。

二、频数分布的Excel处理第五步,在“选择函数”下拉表中选择“统计”选项,然后在“选择函数”列表框中选择FREQUENCY函数,如图所示,单击“确定”按钮,此时会弹出“函数参数”对话框,如图所示。

二、频数分布的Excel处理第六步,在Data_array栏中填写观测值所在区域“B2:B52”,在Bins_array中填写分组端点所在区域“D2:D5”,如图所示.

二、频数分布的Excel处理第七步,在按住Ctrl+Shift的同时按Enter,即得Frequency计算在完成上述两项步骤后的频数,如图所示。

三、频数分布的类型(一)钟型分布钟型分布的特征是“两头小、中间大”,即靠近中间的变量值分布的频数多,靠近两边的变量值分布的频数少,其曲线图像一个古钟,如图所示。一般来说,根据数据采集对象性质的不同,数据采集对象的频数分布主要有三种类型:钟型分布、U型分布和J型分布。

三、频数分布的类型(一)钟型分布钟型分布又可分为对称分布与偏态分布。其中,对称分布的特征是中间变量值分布的次数最多,以标志变量中心为对称轴,两侧变量值分布的次数随着与中间变量值距离的增大而渐次减少,并且围绕中心变量值两侧呈对称分布,这种分布在统计学中称为正态分布。

三、频数分布的类型(二)U型分布U型分布的特征与钟型分布恰恰相反,靠近中间的变量值分布的次数少,靠近两端的变量值分布的次数多,形成“两头大,中间小”的U型分布,如人口死亡现象按年龄分布、机器设备磨损现象按使用时间分布就表现为U型分布。

三、频数分布的类型(三

文档评论(0)

lai + 关注
实名认证
内容提供者

精品资料

版权声明书
用户编号:7040145050000060

1亿VIP精品文档

相关文档