- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
统计学概念连续数据
(也称为可变数据)离散数据
(也称为属性或类别数据)离散数据应用你所学到的东西统计学术语总体-全组数据,全部对象。 -一个总体中的元素数量用N来表示样本-总体的一个子集 -样本的元素数量用n来表示平均值-总体或样本的平均值-总体的平均值用?来表示-样本的平均值用X或?来表示方差-数据与其平均值之间差值的平方的平均值。(它代表该组数据的分散程度)-总体的方差用??表示-样本的方差用s2或??表示均方差是方差的(正)平方根。(它也代表该组数据的分散程度)。-总体的标准差用?来表示-样本的标准差用s或?来表示统计学术语和定义统计学术语和定义举例课堂练习绘制直方图用直方图形成一个连续分布正态分布的标准差(?)面积和概率使用正态表中心极限定理-
为什么我们得到的通常是正态分布中心极限定理-
为什么我们通常得到正态分布关键概念:统计学概念误差存在于所有过程。连续(可变)数据可以有意义地进一步分割,例如,长度,重量。离散数据是以类别形式存在的,不能进行分割。总体就是全部对象。样本就是总体的一个子集。平均值–分布的平均数。标准差–分布的分散程度。方差–标准差的平方。正态分布–对称分布于平均值两边的数据,钟形曲线。标准正态分布–具有平均值(m)=0和标准差(s)=1的正态分布。 关键概念:统计学概念中心极限定理表明,无论单个变量是不是服从正态分布,多个变量的平均值或总和通常近似于正态分布。Z值是平均值与规范的上下限之间所包含的标准差个数Y(‘响应变量’)-因变量X(‘因素’)-独立变量Y=f(X):Y取决于X。通过确定和改进关键的X变量来改进Y。工序能力–过程的偏差与其要求(规范)之间的比较。稳定运行-集中于降低偏差,使坏日子变成好日子。Drivetime-AskaBBhowlong? GradesExplaineach.DescriptiveStatGraph-M-?34Whatareexamplesofcontinuousdata?Fab?Finish?Assy?Field?232528HighlightCDCDDCCCCONT.SCRATCHSURFACETOCHECKHARDNESSCDCC#HRSPASS/FAILGREESIXSIGMA目的:复习基本的统计学概念。 目标:解释以下基本统计概念。1. 误差2. 连续数据和离散数据3. 平均值、方差、标准差4. 正态曲线5. 用Z值将数据标准化6.中心极限定理观测值变化当重复进行测量的时候,通常会得到不同的答案,这就是误差!系统误差预期的和可预测的测量结果之间的差异。举例:夏季和圣诞节假日的电灶销售量不同。随机误差不可预测的测量结果之间的差异。举例:具有同一种设计的两台冰箱,由同一个技术人员、在同样的气温条件下、使用同样的测量仪器,在两个不同的日子对其能量消耗进行测试…...可能得到两个不同的结果。1.2.观测值变化(续)我们预期观测值会有差异。如果没有差异,我们就会产生怀疑。 如果所有地区的电灶销售量是一样的,那么我们就会怀疑是数据库出了问题。. 如果我们测量10台电冰箱,得到同样的能耗测量结果,我们就会怀疑测量是否正确。这种变化使我们的工作更具挑战性!一般来说,我们不能相信来自一个数据点的结果。通常我们收集多个数据点,而且非常注意如何选取这些样本,以减少偏差。偏差的产生是很自然的,意料之中的,是统计学的基础统计学的作用统计学用以下方法处理误差: (置信区间和假设检验)。统计描述用图表和几个总结性数字(均值、方差、标准差)描述一组数据。统计推理确定结果之间的差异何时可能是由于随机误差引起的,何时不能归因于随机误差。收集并分析数据,以估算过程变化的影响。试验设计数据的两种类型连续(可变)数据使用一种度量单位,比如英寸或小时。离散(属性)数据是类别信息,比如““通过”或““未通过”。连续数据离散数据问题解决办法举例: 部件号 离散 连续 1 通过 2.031 2 通过 2
文档评论(0)