统计学基础知识.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2 2 、数据的特征值 (一)数据的位置特征值 1)平均值x 如果从总体中抽取一个样本,得到一批数据 Xi, X2, X3….Xn,则样本的平均值 X为: — 1 n X X i n i 1 n-数据个数; Xi-第i个数据数; 刀-求和。 2)中位数x 有时,为减少计算,将数据 Xi , X2, X3….Xn按大小次序排列,用位居于正中的那个数或 中间两个数的平均值(当数据为偶数时)表示数据的总体平均水平。 3)中值M测定值中的最大值 3)中值M 测定值中的最大值 Xmax与最小值Xmin的平均值,用 M表示。 X m ax X m in 4)众数 在用频数分布表示测定值时,频数最多的值即为众数。若测定值按区间做频数分布时, 频数最多的区间代表值(一般取区间中值)也称众数。 (二)数据的离散特征值 1)极差R 测定值中的最大值 Xmax与最小值Xmin之差称为极差。通常 R用于个数n小于10的情况 下,n大于10时,一般采用标准偏差 s表示。 2)偏差平方和S _ 各测定值Xi与平均值X 之差称为偏差。各测定值的偏差平方和称为偏差平方和,简称 平方和,用S表示。 无偏方差各个测定值的偏差平方和除以( 无偏方差 各个测定值的偏差平方和除以( n-1)后所得的值称为无偏方差(简称方差),用s2表示: S = (X 1 X ) 2 ( X 2 x ) 2 ...(X n x ) n = (Xi X ) 2 i 1 n (Xi 欢迎下载 欢迎下载 PAGE # 标准偏差s 标准偏差s 方差s2的平方根为标准偏差(简称标准差),用s表示: (三)变异系数 以上反映数据离散程度的特征值, 只反映产品质量的绝对波动大小。 在工程实践中, 量较大的产品,绝对误差一般较大, 反之亦然。因此要考虑相对波动的大小,在统计技术上 用变异系数CV来表达: 上式中c 上式中c和卩为总体均值和总体标准差, 用样本标准差s和样本均值 x估计。 当过程在受控状态下, 且样本容差较大时, Ca、Cp、Cpk的计算 过程准确度指数(Ca值):表示过程特性中心位置的偏移程度,越小越好 Ca=(样本平均值-规格中心值)/ (规格公差/2) 等级A : |Ca|三12.5%表示作业员遵守作业规范 ,并达规格要求 等级B : 12.5% |Ca|三25%表示必要时尽可能提升至 A级 等级C: 25% |Ca|三50%表示作业员可能看错或未按标准作业,或须修改规格及作业标准。 等级D : 50% |Ca|表示应采取紧急措施,全面整改可能影响之因素,必要时应停止生产 过程精密度能力系数(Cp值):表示过程特性分散的程度,值越大越集中。 Cp=(规格上限-规格下限”(6X标准差) 合格:1.33三Cp表示能力足够 警告:1.00三Cp 1.33表示能力无足够宽度,平均值稍有偏差时,不良率既会增加。 不合格:Cp 1.00表示能力不足,有不合格品,须全数筛选,并设法缩小变异或整改规格公差。 过程综合能力系数(Cpk值):同时考虑 偏移”程度及 分散程度 Cpk=(1-Ca) x Cp 此系数为过程评价用系数,用于过程改善 客户指定Cpk值时,欲达到此 Cpk值,可先探讨 Ca及Cp值:准确度”精密度”是否有适当能 力 一般客户是指定值多数为三 1.33; Cpk值三3.00时,表示过程能力已经足够了,继续维持即可; 若想进一步改善,应考虑成本效益。 Cp=(Ucl-Lsl)/6 8 Cpku=(Uc I- Xbar)/3 8 Cpkl=(Xbar-Lsl)/3 8 Cpk=min(Cpku : Cpkl) 二、回归分析 什么是回归分析 回归分析是用来研究一个指标与几个变量间的相关关系的方法。 设有两个变量X和y,前者为自变量,后者为因变量,并均为随机变量。当自变量 X变 化时,丫会产生相应的变化,如果具有大量或较多的统计数据( x,yi),则可以用数学 方法找出两者之间的统计关系 y= f(x),这种数学方法称为回归分析。 当y= a+ bx时,称之为一元线性回归; 当y= f(x)为非线性函数关系时,称之为非线性回归; 当X变量不止1个,有几个时,即有(X1 , X2 ???, Xn),则y = f ( X1 , X2 ???, Xn) 称之为多元回归。 当有y= a+ bi x i + b2 X2+ ???+ bn x n时,称之为多元线性回归,否则为多元非 线性回归。 回归分析可用于预测、质量控制等方面。 一元线性回归方程的计算方法 设一元线性回归方程的表达式为 :y=a+bx b xy Lxx Lxx n (Xi i 1 X)2 Lyy n i 1 y)2 现在给出了 n对数据(Xi, yi ),要求根据这些数据去估计 a与b的值。则: a y bx 其中 Lxx

您可能关注的文档

文档评论(0)

某某先生 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档