数据的处理.docVIP

下载本文档

9
0
约 27页
2017-08-25 发布于重庆
举报
版权申诉

数据的处理.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

4 数据处理 2 当从频率分布表出发时，样本方差和样本标准差的定义是： 4.2.3 标准差和方差的数学意义很明显，方差s2也是一组数的均值——它是各xi与ˉx的偏差之平方（x1－x）2，（x2－x）2，…，（xn－x）2这n个数的均值，是平均的平方偏差，因此称它为方差。标准差s是方差s2 的算术平方根，它与x1，x2，x3，…，xn。有相同的度量单位。容易看出，s2 越大，这组数据就越“分散”，或者说，这组数据的变异性（即互相不同的程度）就越大；s2 越小，这组数据的变异性就越小，也就更“集中”。当s2=2时，x1=x2＝x3＝…＝xn＝x，就没有变异。因此，对一组数据x1，x2，x3，…，xn作分析时，x与s（或s2）是最常用的两个量：一个是代表性的值(指ˉx)；一个是描述数据的变异性的值（指s或s2）。 4.3 数据的列表整理法 4.3.1 列表整理概述收集的数据是零乱无章的，很难直接应用，通常须经过整理才能进行分析研究。数据整理的具体方法有多种多样，归纳起来，无外乎三种类型：一是将数据重新排列、组合，整理成某种表格形式；二是整理成某种图形的形式；三是通过不太复杂的数学运算、计算一些特征值。整理，不仅使得零乱的数据化为醒目的形式，还常能反映出总体的某些分布特征，为分析研究提供重要的信息资料。数据的整理既重要，又繁琐。这一章里，我们介绍几种质量管理中经常用到的、也是最基本的列表整理方法。 4.3.2顺序及权数整理顺序整理与权数整理是最简单的数据整理方法、它们往往是数据进一步整理的基础。 1）顺序整理顺序整理指将原始数据按从小到大或从大到小的顺序重新排列。数据经顺序整理后，数据中的最大、最小值，一目了然。例如，下面表4—1中数据，按从小到大的顺序整理为表4—2的形式，即表4—2为原始数据的顺序整理表。 2）权数整理权数整理是将原数据依从小到大的顺序排列，相同的数据只记一次，并以“权数”来表示该数据出现的频率，整理成权数表形式（见表4—3）。一般，权数整理后的第i个数据记为xi，xi的权数记为pi。权数越大的数据，其出现的频率越大，这个数据对全局的影响也越大。形象地说，它的“权”也越大。权数最大的数据也被称为众数。下面看一个权数整理的例子。例4—1试对表4－1的数据做权数整理，并指出众数。解：数据总个数：n=10。合并相同的数据后，共有7个不同数据，列权数整理表为： 4.3.2 数据的分层法分层法也叫分类或分组法。分层法是一种把收集来的数据，按照一定的标志进行分类的方法。一个数据的形成受多方面的原因所影响，把诸多性质不同的原因而影响形成的数据搅在一起，很难理出头绪米。而如果按照适当的标志将数据加以分类，如按照来源、影响因素、方法、材料等特性指标来分类，会使数据较分类前更清晰、更准确地反映数据所代表的客观事实，便于我们看出问题的主线。分层法的基本原则是将性质相同的数据归在一起，这里所说的性质也就是分层的标志，恰当地选择标志，才可能实现分层的目标，标志选择不适当，分层后可能没有任何实际指导意义。当然，并不是所有问题的所有数据都必须经过分层整理，分层的方式也没有什么统一的格式或规定，只要能够根据以往的经验，结合本专业的技术知识，恰当地选择分层标志，达到能从分层后的数据中看出问题或找出主要原因的目的就行。比如，可以结合实际问题，选择以下的某种标志进行分类： 1）按操作人员分：如按照工龄、男工与女工、操作工等级进行分类。 2）按使用的设备分：如按不同的装置、流水线、不同的机床型号等分类。 3）按原材料分：如按不同产地的原材料、不同贮存方法或不同保存时间的原料等进行分类。 4）按工艺条件分：如按不同配料比、加剂时间、不同的温度等分类。 5）按不同的时间分：如按不同的班次、不同的日期等分类。 6）按不同的检测手段分：如按不同的检测仪器，不同的化验室，不同的检测方法等分类。还可以按照其他的各种标志来分类、这里不再一一列举，下面我们来看两个分层的例题。例4—2某QC小组针对本车问产品的某含量时常偏高问题，从不合格品中随机抽取了70个样品。欲通过分类找出产生不合格品的主要原因。 1）当小组成员对不合格品的样本，按照生产的4个班次分类时，得到的结果见表4—4。从这个分类统计表中看不出什么条理、头绪来，即选择时间为分层标志，使这次分层没有明显的指导意义。故他们考虑重选分层标志。 2）按照导致含量偏高的原因进行分类，结果见表4—5。从影响因素来分类、我们看到导致产品某含量过高的主要原因是塔顶温度偏高。这样，在解决质量问题过程中抓住了主要矛盾。例4—3某厂将一个月的所有质量差错按工人级别与性别两个标志进行分类