统计学基础知识点.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

统计学基础知识点

一、统计学的基本概念

统计学是一门收集、整理、分析和解释数据的科学。数据是统计学的核心,它可以是数字、文字或图像等形式。总体是包含所研究的全部个体(数据)的集合,而样本则是从总体中抽取的一部分用于代表总体进行研究的个体集合。例如,研究一个城市所有居民的收入情况时,这个城市的全体居民收入就是总体,从中抽取一部分居民的收入数据就是样本。

二、数据的类型

1.定量数据

-数值型数据,可进一步分为离散型数据和连续型数据。离散型数据只能取特定的数值,如班级中的学生人数,只能是整数。连续型数据可以取任何数值,如人的身高、体重等,可以是小数。

2.定性数据

-分类数据,例如性别(男、女)、血型(A、B、AB、O)等,这类数据只表示类别,没有顺序关系。

-顺序数据,如比赛的名次(第一名、第二名等),这类数据有顺序之分,但相邻数值之间的差距不明确。

三、数据的收集方法

1.普查

-对总体中的所有个体进行调查。例如全国人口普查,这种方法能得到全面、准确的信息,但成本高、耗时长。

2.抽样调查

-从总体中随机抽取一部分样本进行调查,然后根据样本情况推断总体特征。例如市场调查公司通过抽样调查部分消费者来了解整个市场的消费倾向。抽样方法包括简单随机抽样、分层抽样、系统抽样等。简单随机抽样是完全随机地从总体中抽取样本;分层抽样是将总体按照某些特征分成若干层,然后从各层中分别抽样;系统抽样是按照一定的规则抽取样本,如每隔一定数量的个体抽取一个。

四、数据的整理与展示

1.数据的分组

-将数据按照一定的标准分成不同的组。例如将学生的考试成绩按照分数段进行分组。

2.频数分布表

-用来展示各个组中数据出现的频数(次数)。它可以直观地反映数据在各个组中的分布情况。

3.统计图

-柱状图适用于展示分类数据的频数分布,不同的类别对应不同高度的柱子。

-折线图常用于展示时间序列数据,能清晰地反映数据随时间的变化趋势。

-饼图用于展示各部分在总体中所占的比例关系。

五、描述性统计量

1.集中趋势度量

-均值(平均数),是所有数据的总和除以数据的个数。它是最常用的集中趋势度量,但容易受到极端值的影响。

-中位数,将数据按照大小顺序排列后,位于中间位置的数值。如果数据个数为奇数,中位数就是中间的那个数;如果数据个数为偶数,中位数是中间两个数的平均值。中位数不受极端值的影响较大。

-众数,数据中出现次数最多的数值。一组数据可能有一个众数,也可能有多个众数或者没有众数。

2.离散程度度量

-极差,是数据中的最大值与最小值之差,它简单地反映了数据的波动范围。

-方差,是各个数据与均值之差的平方和的平均数。方差越大,数据的离散程度越大。

-标准差,是方差的平方根。它与原始数据的单位相同,更直观地反映数据的离散程度。

六、概率基础

1.事件与概率

-事件是试验或观察的结果。概率是衡量事件发生可能性大小的数值,取值范围在0到1之间。0表示事件不可能发生,1表示事件必然发生。

2.概率的计算

-古典概型,在等可能样本空间中,事件A的概率等于事件A包含的基本事件个数除以样本空间的基本事件总数。例如掷骰子,掷出3点的概率是1/6。

-条件概率,在事件B已经发生的条件下,事件A发生的概率,记为P(A|B)。

七、概率分布

1.离散型概率分布

-二项分布,用于描述n次独立重复试验中,成功次数的概率分布。例如抛硬币n次,正面朝上次数的分布。

-泊松分布,常用于描述在一定时间或空间内稀有事件发生的次数的分布。如单位时间内电话呼叫次数的分布。

2.连续型概率分布

-正态分布,是最重要的连续型概率分布,其图形呈钟形。许多自然现象和社会现象都近似服从正态分布,如人的身高、体重等。

八、抽样分布

1.样本均值的抽样分布

-当从总体中抽取样本容量为n的样本时,样本均值会有一个分布。根据中心极限定理,在样本容量足够大(n≥30)时,无论总体服从什么分布,样本均值的抽样分布近似服从正态分布。

2.其他抽样分布

-如t分布、F分布等,它们在不同的统计推断场景下有着重要的应用,例如在小样本情况下的总体均值推断中会用到t分布。

文档评论(0)

资料库 + 关注
实名认证
文档贡献者

实时更新

1亿VIP精品文档

相关文档