- 1、本文档共27页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
數据的处理
PAGE 26
PAGE 27
4 数据处理
4.1 个体、总体和样本
1)个体
构成总体或样本的基本单位叫个体。
这里的基本单位可以是一件物品,如一筒POY丝,一条编织袋,一个机器零件;也可以是一定量的物质,如200ml航空煤油,100g催化剂;个体还可以泛指观测值,如一组观测值为x1,x2,x3,…,xn,则任意一个观测值xi就是一个个体。
2)总体
所要研究或考虑的个体的全体,称做总体。总体也称为母体,习惯上总体用大写英文字母来表示。
例如,考察某厂92年3月25日包装出的全部袋装尿素时,这天的全部袋装尿素便是我们所考察问题的总体。一个班次某天生产的全部柴油;一次到货的某型低温度换催化剂;拉丝工序生产的全部变形丝等。
总体中所含的个体数目或单位量数目称为总体容量或总体的大小。如40000袋化肥,30000m3
有限总体指总体中所含的个体数目是有限的。如上面所列举的总体的例中,前三个总体都可认为是有限总体。
无限总体指总体中所含的个体数目无限多。如所举例中的第四个总体。一般对某流水线上产品做定时定量、不断抽样检测时,
可视该流水线上的产品为无限总体;长期开工的某道工序上的全部半成品也可视为无限总体。在实际应用中,无特别要求时,无需专门去区分两种总体。
3)样本
从总体中抽取的一部分个体,组成总体的一个样本。样本也称子样。构成样本的个体称为样品。
例如,从3月25日生产的袋装尿素中随机抽取100袋,则这100袋尿素就构成第一个总体的一个样本。被抽到的每袋尿素都称为样品。又如,从馏出口取得8个200rnl的柴油样,可构成第二个总体的一个样本,每次取得的200ml的柴油,为一个样品。
样本的大小等于样本中所包含的抽样单位数目,也称为样本容量。习惯上,样本容量用字母n表示。如刚提到的这两个样本,第一个样本的容量为100、第二个样本容量为8。
4)样本、总体及数据的关系
我们研究的对象是一个事物的整体。如一批产品、一项工程、一条完整的作业生产线等。从它们之中取得数据的目的是为了衡量整体的质量是否合乎规格的要求,但实际上,对总体完全地、一个不漏地进行测试以取得数据、是不现实的。一般采取从总体中抽取一定量(或一定比例)的个体,构成样本,并作为总体的代表接受检验。
样本取自总体,样本能否真正地反映。单体、代表总体,很大程度上取决于取样方法。样本和总体的特征完全一致的情形,是极为少见的,但只要取样方法适当,样本容量适宜,样本则可能较好地反映出总体的特征。为了使样本尽可能准确地反映总体特征,一般采取随机抽样方式,即不加任何主观意愿的去抽取样本,使总体中每一个个体被取中的可能性是一样的。
当我们从有限总体中随机抽取一定容量的样本之后,要通过测试得到样本中每一个样品的测定值,这就是数据,然后通过对数据的整理分析,得到样本的特征,再以样本的特征去推断总体的特征。
这种有限总体、样本与数据之间的关系,可用下面的框图(见图—1)来表示。
图—1 有限总体、样本与数据的关系
为了对生产过程中某道工序进行预防性控制和管理,我们常以该工序为无限总体,在它生产加工过程或已加工出还未进入下道工序的产品中,经常或定期地抽取样本,进行测试分析,以判断工序状态,这种无限总体、样本与数据间的关系,可用下面框图(见图—2)来表示。
总之一总体与样本、数据之间的关系可用图—3框图来表示。
图-2 无限总体、样本和数据的关系 图—3 总体、样本和数据的关系
4.2 平均数、标准差和方差
在实际使用中,样本平均数x与样本标准差s是两个最常用的特征数。上面已说过,前者属于位置特征数,而后者则是离散特征数。
4.2.1 平均数ˉx
设有容量为n的样本:
x1,x2,x3,…,xn
所谓样本的平均数x就是:
x =1/n(x1+x2+x3+…+xn)
或者
x =1/n ∑xi (i=1,2,3,…,n)
1)从频数表求平均数
前面说过,无论对哪一种变量,样本数据往往被整理成频数频率分布表。那么从已整理好的频数表又怎样去求平均数呢?设频数表如下:
2)加权平均数
4.2.2 标准差和方差
1)标准差s
2)方差s2
当从频率分布表出发时,样本方差和样本标准差的定义是:
4.2.3 标准差和方差的数学意义
很明显,方差s2也是一组数的均值——它是各xi与ˉx的偏差之平方(x1-x)2,(x2-x)2,…,(xn-x)2这n个数的均值,是平均的平方偏差,因此称它为方差。标准差s是方差s2 的算术平方根,它与x1,x2,x3,…,xn。有相同的度量单位。容易看出,s2 越大,这组数据就越“分散”,或者说,这组数据的变异性(
您可能关注的文档
- 數据挖掘在物流管理中的作用及应用.doc
- 數据挖掘在淘宝卖家评论中的应用.doc
- 數据挖掘在电子商务中的应用.doc
- 數据挖掘在移动通信决策支持系统中的应用.doc
- 數据挖掘在营销中的应用.docx
- 數据挖掘在软件工程中的应用.doc
- 數据挖掘在采矿工程中的应用.doc
- 數据挖掘基于贝叶斯算法及KNN算法.docx
- 數据挖掘大作业结果分析报告.docx
- 數据挖掘技术在电视邮件播发中的应用有线电视技术稿.doc
- 湘教版高中美术选修:美术鉴赏 第一单元 第二课 图像与眼睛(2)(课件)(32张PPT)(内嵌视频).pptx
- 湘美版高中美术绘画 第四课 油画 课件(共98张PPT)(内嵌视频).pptx
- 第10课 人类生活的真实再现——外国古代绘画撷英 课件-高中美术人美版必修美术鉴赏(35张PPT)(内嵌视频).pptx
- 人教版高中美术选修:美术鉴赏 第八课 与时俱进——木刻、漫画、现代雕塑(2) 课件(19张PPT)(内嵌视频).pptx
- 5.2 质朴与率真——浓郁乡情的视觉呈现 课件 高中美术人美版(2019)美术鉴赏(17张PPT)(内嵌视频).pptx
- 人教版美术四年级下册第9课 对称的美 课件(共24张PPT)(内嵌视频).pptx
- 鲁美版 高中美术 第9课 20世纪西方美术的多样表达 课件(共26张PPT)(内嵌视频).ppt
- 人美版高中必修美术《美术鉴赏》第五课:美术作品可以什么都不像吗——走进抽象艺术(59张PPT)(内嵌视频).ppt
- 人教版高中美术选修:美术鉴赏 第四课 天上人间——壁画(3) 课件(24张PPT)(内嵌视频).pptx
- 人教版美术二年级下册 14.友谊卡 课件(共31张PPT)(内嵌视频).pptx
文档评论(0)