[理学]统计2章教材.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[理学]统计2章教材

2 计量资料分析 连续变量总体的样本资料,一般是计量资料。正态总体的计量资料分析,包括统计描述和统计推断。统计描述,主要是用样本数字特征、S2作总体数字特征μ、σ2的点估计。统计推断,主要是用样本数字特征、S2作总体数字特征μ、σ2的区间估计或假设检验。 2.1 计量资料的区间估计 2.1.1 随机抽样 统计工作一般经过统计设计、搜集资料、整理资料、分析资料四个步骤。统计设计是对全过程进行全面设想、规划,选用区间估计、假设检验、回归分析、试验设计等具体统计方法。搜集资料是根据研究目的,按试验设计的要求进行抽样,或搜集报表,或进行试验,搜集准确的、完整的、充满信息的原始资料。整理资料是按设计要求对搜集到的原始数据进行分组和归纳,使资料系统化、条理化,以便进行统计分析。分析资料是按设计要求对经过整理的原始资料进行计算和统计处理,得出科学、合理的统计结论。 不同的统计资料采用的统计方法也会不一样。统计资料的类型一般分为计量资料、分类资料两大类型。计量资料是对观察对象用定量方法测得的某项指标的值,分为定量(有大小和单位)与循环(有单位无大小,如角度、时间等)两种,一般是连续变量总体的样本资料。分类资料是把观察对象按不同属性或类别分组计数所得的资料,分为无序分类(计数资料)与有序分类(等级资料)两种,一般是离散变量总体的样本资料。资料的类型,可以根据需要进行转化。如:每个人的血红蛋白量是计量资料,按血红蛋白量分为正常与异常两组的人数是计数资料。以6(g/dl、9(g/dl、12(g/dl、16(g/dl为分组的端点值,按血红蛋白量分为重度贫血、中度贫血、轻度贫血、正常血红蛋白量、增高血红蛋白量,五组的人数是等级资料。 总体是根据一定的研究目的和要求所确定的研究对象的全体,构成总体的每一个对象称为个体。从总体中抽取的部分个体称为样本,从总体中抽取样本的过程称为抽样,样本所包含的个体的数目称为样本容量。从总体X中随机抽取容量为n的样本,记为X1、X2、…、Xn,可看成是n个随机变量。抽样的目的是通过对样本的考察和分析,从而根据该样本所提供的信息对总体的分布特性或某些特征做出估计和推断。因此,通常要求样本具有代表性(Xi与总体X同分布)与独立性(X1、X2、…、Xn独立),并称这样的样本为简单随机样本。在抽取样本时,要求方法简单易行,并且对抽取的数据便于用统计方法进行处理和推断。抽样的方法很多,对于有限总体,一般采用有放回的抽样,在总体的研究对象数量相对于样本大得多时,可近似采用无放回的抽样。总体中的每一个研究对象以相等的概率被抽取,这种等概率抽样称为单纯随机抽样,常用抽签或查随机数表等方法实施。 若采用机械抽样(按一定的间隔抽取,如取4号、24号、44号、……),分层抽样(把研究对象分为互不重叠的层,在各层随机抽样),整群抽样(把研究对象分为互不重迭的群,随机抽取若干群的全体),则可以得到非简单随机样本。 2.1.2 无偏点估计 统计描述,主要是用样本数字特征、S2作总体数字特征μ、σ2的点估计。 定义1 设X1,X2,…,Xn是从总体X中抽取的一个容量为n的简单随机样本,则分别定义样本均数(mean)、样本方差(variance)为 (2-1) (2-2) 并称S为样本标准差(standard deviation,SD),称S/为样本变异系数。 反映集中趋势的样本数字特征,有样本均数、中位数(median,居中位置的值)、众数(mode,频率最大的值)等。反映离散程度的样本数字特征,有样本方差、样本标准差、样本变异系数、样本标准误(standard error,SE)、极差(range,最大与最小值之差)、四分位数(25%及75%位置值)等。样本均数与标准差、标准误常合写在一起,记为 或 (2-3) 或 (2-4) 用样本构成的不含总体任何未知参数的函数,称为一个统计量(statistic)。用来估计总体参数θ的统计量,记为。这种用样本统计量直接作为总体未知参数θ估计值的方法,称为点估计。在=θ时,称为θ的无偏估计量。的一个具体值,称为总体参数θ的一个点估计。无偏性、有效性、一致性,是评价估计量好坏的三条标准。 定理1 设X1,X2,…,Xn为总体X的简单随机样本,则 (2-5) (2-6) (2-7) 证 X1,X2,…,Xn与总体X独立同分布,EXi=EX,DXi=DX, 由定理1的2-5、2-7可知,样本均数、样本方差S2分别是总体均数EX、总体方差DX的一个无偏点估计。函数计算器的SD(标准差)模式,用Data键输入数据,用、S键,可以计算样本均数、样本标准差S。 类似地,用∑作为总体M阶原点矩的估计量,称为矩估计;用密度函数f构成似然函数∏f(Xi)求最大值确定总体参数的估计量,称为最大似然估计。样本方差

文档评论(0)

qiwqpu54 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档