数据的处理.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
4 数据处理 2 当从频率分布表出发时,样本方差和样本标准差的定义是: 4.2.3 标准差和方差的数学意义 很明显,方差s2也是一组数的均值——它是各xi与ˉx的偏差之平方(x1-x)2,(x2-x)2,…,(xn-x)2这n个数的均值,是平均的平方偏差,因此称它为方差。标准差s是方差s2 的算术平方根,它与x1,x2,x3,…,xn。有相同的度量单位。容易看出,s2 越大,这组数据就越“分散”,或者说,这组数据的变异性(即互相不同的程度)就越大;s2 越小,这组数据的变异性就越小,也就更“集中”。当s2=2时,x1=x2=x3=…=xn=x,就没有变异。 因此,对一组数据x1,x2,x3,…,xn作分析时,x与s(或s2)是最常用的两个量:一个是代表性的值(指ˉx);一个是描述数据的变异性的值(指s或s2)。 4.3 数据的列表整理法 4.3.1 列表整理概述 收集的数据是零乱无章的,很难直接应用,通常须经过整理才能进行分析研究。 数据整理的具体方法有多种多样,归纳起来,无外乎三种类型:一是将数据重新排列、组合,整理成某种表格形式;二是整理成某种图形的形式;三是通过不太复杂的数学运算、计算一些特征值。 整理,不仅使得零乱的数据化为醒目的形式,还常能反映出总体的某些分布特征,为分析研究提供重要的信息资料。数据的整理既重要,又繁琐。这一章里,我们介绍几种质量管理中经常用到的、也是最基本的列表整理方法。 4.3.2顺序及权数整理 顺序整理与权数整理是最简单的数据整理方法、它们往往是数据进一步整理的基础。 1)顺序整理 顺序整理指将原始数据按从小到大或从大到小的顺序重新排列。数据经顺序整理后,数据中的最大、最小值,一目了然。 例如,下面表4—1中数据,按从小到大的顺序整理为表4—2的形式,即表4—2为原始数据的顺序整理表。 2)权数整理 权数整理是将原数据依从小到大的顺序排列,相同的数据只记一次,并以“权数”来表示该数据出现的频率,整理成权数表形式(见表4—3)。 一般,权数整理后的第i个数据记为xi,xi的权数记为pi。 权数越大的数据,其出现的频率越大,这个数据对全局的影响也越大。形象地说,它的“权”也越大。权数最大的数据也被称为众数。 下面看一个权数整理的例子。 例4—1试对表4-1的数据做权数整理,并指出众数。 解:数据总个数:n=10。合并相同的数据后,共有7个不同数据,列权数整理表为: 4.3.2 数据的分层法 分层法也叫分类或分组法。分层法是一种把收集来的数据,按照一定的标志进行分类的方法。 一个数据的形成受多方面的原因所影响,把诸多性质不同的原因而影响形成的数据搅在一起,很难理出头绪米。而如果按照适当的标志将数据加以分类,如按照来源、影响因素、方法、材料等特性指标来分类,会使数据较分类前更清晰、更准确地反映数据所代表的客观事实,便于我们看出问题的主线。 分层法的基本原则是将性质相同的数据归在一起,这里所说的性质也就是分层的标志,恰当地选择标志,才可能实现分层的目标,标志选择不适当,分层后可能没有任何实际指导意义。当然,并不是所有问题的所有数据都必须经过分层整理,分层的方式也没有什么统一的格式或规定,只要能够根据以往的经验,结合本专业的技术知识,恰当地选择分层标志,达到能从分层后的数据中看出问题或找出主要原因的目的就行。比如,可以结合实际问题,选择以下的某种标志进行分类: 1)按操作人员分:如按照工龄、男工与女工、操作工等级进行分类。 2)按使用的设备分:如按不同的装置、流水线、不同的机床型号等分类。 3)按原材料分:如按不同产地的原材料、不同贮存方法或不同保存时间的原料等进行分类。 4)按工艺条件分:如按不同配料比、加剂时间、不同的温度等分类。 5)按不同的时间分:如按不同的班次、不同的日期等分类。 6)按不同的检测手段分:如按不同的检测仪器,不同的化验室,不同的检测方法等分类。 还可以按照其他的各种标志来分类、这里不再一一列举,下面我们来看两个分层的例题。 例4—2某QC小组针对本车问产品的某含量时常偏高问题,从不合格品中随机抽取了70个样品。欲通过分类找出产生不合格品的主要原因。 1)当小组成员对不合格品的样本,按照生产的4个班次分类时,得到的结果见表4—4。 从这个分类统计表中看不出什么条理、头绪来,即选择时间为分层标志,使这次分层没有明显的指导意义。故他们考虑重选分层标志。 2)按照导致含量偏高的原因进行分类,结果见表4—5。 从影响因素来分类、我们看到导致产品某含量过高的主要原因是塔顶温度偏高。这样,在解决质量问题过程中抓住了主要矛盾。 例4—3某厂将一个月的所有质量差错按工人级别与性别两个标志进行分类

文档评论(0)

aiwendang + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档