- 1、本文档共110页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
五、中心极限定理 ? 随机变量的独立性 随机变量X1与X2相互独立是指其中一个取什么值不影响另一个的取值,或者说是指两个随机变量独立的取值,互不影响。 随机变量的独立性可以推广到3个或更多个随机变量。 ? 中心极限定理 在统计中,多个相互独立随机变量的平均值(仍然是一个随机变量)将服从或近似服从正态分布。 即n个相互独立同分布的随机变量X1,X2, ……Xn,均值μ和方差 都存在,则在n较大时,其样本均值 服从或近似服从正态分布N(μ, )。 第三节 统计基础知识 一、总体、个体与样本 (一)总体与个体 总体:在一个统计问题中,我们把研究对象的 全体成为总体。 —— 当研究产品某个特定的质量特性X时, 也常把全体产品的特性看做为总体。 个体:构成总体的每个成员。 —— 当研究产品的某个特定的质量特性X时, 把一个具体产品的特性值x视为个体。 (二)随机样本 满足下面两个条件的样本称为简单随机样本,简称随机样本: 1. 随机性。总体中每个个体都有相同的机会 入样。 2. 独立性。从总体中抽取的每个样品对其它 样本的的抽取无任何影响。 ? 随机样本可看做n个相互独立的、同分布 的随机变量,其分布与总体分布相同。 ? 下面所述的样本都是指满足这两个要求的 简单随机样本。 二、频数(频率)直方图 为了研究数据的变化规律,需要对数据进行一定的加工整理。直方图是为研究数据变化规律而对数据进行加工整理的一种基本方法。 (一)直方图的作法 [例1.3-3] 食品厂用自动装罐机生产罐头食品,从一批罐头中随机抽取100个进行称量,获得罐头的净重数据如下: 为了解这组数据的分布规律,对数据做如下整理: (1)找出这组数据中的最大值xmax及最小值xmin,计算它们的差R= xmax- xmin,R称为极差,也就是这组数据的取值范围。在本例中xmax=356,xmin =332,从而R=356-332=24。 (2)根据数据个数,即样本量n,决定分组数k及组距h。 一批数据究竟分多少组,通常根据n的多少而定,不过这也不是绝对的,教材中1.3-2是可以参考的分组数。 选择k的原则是要能显示出数据中所隐藏的规律,组数不能过多,但也不能太少。 每一组的区间长度,称为组距。组距可以相等,也可以不相等。组距相等的情况用得比较多,不过也有不少情形在对应于数据最大及最小的一个或两个组,使用与其他组不相等的组距。对于完全相等的组距,通常取组距h为接近的某个整数值。 在本例中,n=100,取k=9,R/k=24/9=2.7,故取组距h=3。 (3)确定组限,即每个区间的端点及组中值。为了避免一个数据可能同时属于两个组,因此通常将各组的区间确定为左开右闭的: 通常要求 <xmin, >xmax。在等距分组时, , …, ,而每一组的组中值 在本例中取 =331.5,则每组的组限及组中值见表1.3-3。 (4)计算落在每组的数据的频数及频率 确定分组后,统计每组的频数,即落在组中的数据个数以及频率 ,列出每组的频数、频率表,见表1.3-3。 频数、频率及累积频率表 表1.3-3 (5)作频数频率直方图 在横轴上标上每个组的组限,以每一组的区间为底,以频数(频率)为高画一个矩形,所得的图形称为频数(频率)直方图,如图1.3-4。在本例中频数直方图及频率直方图的形状是完全一致的。这是因为分组是等距的。 在分组不完全等距的情形,在作频率直方图时,应当用每一个组的频率与组距的比值 / 为高作矩形。此时以每个矩形的面积表示频率。 频数(频率)直方图 ? 重要结论: 1.X在区间(a,b)上取值的概率 p(a<X<b)为概率密度曲线以下区间(a,b)上的面积,即 P(a<Χ<b)= 2. X在一点取值的概率为零,即 P(X=a)=0 故:P(a<x<b)=P(a≤x≤b) =P(a≤X<b) =P(a<X≤b) 三、随机变量分布的均值、方差与标准差 ? 均值: 用来表示分布的中心位置,用E(X)表示 X是离散随机变量 X是连续随机变量 ? 方差: 用来表示分布的散布大小,用Var
文档评论(0)