- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计学(无敌权威完整版重点)
统计学
数据与统计学
1.1统计数据与统计学
(1)统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探究数据内在的数据量规律性,为决策提供参考(含义)
(2)应用统计研究过程:
实际问题→收集数据(取得数据)→整理数据(处理数据)→显示数据→分析数据
→解释数据→实际问题
(3)例子:新生婴儿的性别、掷硬币和骰子、农作物试验、商品广告、汽车合格的统计、化妆品试用的抽样。
1.2 统计学的产生和发展
(1)三个源头:◎英国经济学家威廉·配第◎英国约翰·格朗特
◎布莱斯·帕斯卡、皮埃尔·德·费马。
1.3 统计学的分类
(1)描述统计:是用图形、表格和概括性的数字对数据进行描述的统计方法。
(2)推断统计:是根据样本信息对总体进行估计、假设检验、预测或其他推断的统计
方法。
(3)统计学分为描述统计和推断统计,一方面反映了统计发展的前后两个阶段。另
一方面夜反映了统计方法研究和探索客观事物内在数量规律性的先后过程。
(4)
图 统计学探究客观现象数量规律性过程的款图
(5)统计研究过程的起点是数据,终点是探索到客观事件总体内在的数据规律性。描述统计是整个统计学的基础和统计研究工作的第一步,推断统计是现代统计学的核心和统计研究工作的关键环节。
(6)理论统计和应用统计
1.4 统计数据的来源
(1)统计数据的来源:按直接获取和间接获取分类。
(2)直接获取的数据:普查:应用面窄、费时费力、反映总体数据的手段、实效性差。
抽样调查:节省人力物力、实效性强、有误差。
1.5 统计数据的质量
(1)统计调查阶段是统计研究的第一步,是直接收集统计数据的阶段。可分为非抽样误差和抽样误差。
1.6 统计学的基本概念
(1)总体:是人们研究的所有基本单位的总和。
(2)变量:在研究总体时,重点关注的是总体单位具有哪些特征和属性,指这些特征。
(3)参数:概括性的数学度量。(主体)
(4)统计量:概括样本的数学度量。(样本)
(5)样本:是总体的一部分单位。
1.7 数据的有关知识
一、数据的计量尺度
1.列名尺度(定类尺度):层次最低、平行分类、列名时要穷尽所有的。“= ≠”
2.顺序尺度(定序尺度):在分类的基础上给出类别的顺序。 “﹥﹤”
3.间隔尺度(定距尺度):更加准备的测量,没有绝对的零点。 “+-”
4.比例尺度(定比尺度):有绝对的零点。 “+-×÷”
四种计量尺度的比较
定类 定序 定距 定比 分类 √ √ √ √ 排序 √ √ √ 间距 √ √ 比值 √ 二、数据类型
1.数据的类型分为定性(品质)和定量(数量)。
2.变量:品质变量和数量变量。
三、数据的表现形式
1.分绝对数(总量的时期数和相对数)和相对数(两个绝对值的比值)
2.单位:实物单位、价值单位、复合单位。
统计数据的描述
2.1数据统计的整理
数据的预处理
审核:原始资料(完整性、准确性)
第二手资料(适用性、实效性)
筛选
排序:按照一定的顺序将数据进行排序。
统计数据的分组
1.分组的定义:将数据按照一定的特征标准分组。
2.品质标志分组:按照性别、质量、民族等定性指标分组(定类、定序)
数量标志分组:按照数量或数值等定量指标分组。(定距、定比)
次数(频率)分配
数量标志分组方法:单变量分组---只适合离散型变量
组距分组
组距分组:将其分为若干个区间。
步骤:①确认组数(斯特格斯公式 K=1+㏒N/㏒2)基本为奇数(5-15)
②组距:上限值-下限值
公式:组距==(最大值-最小值)÷组数
③整理成频率分布表 原则:不重不漏
④等距分组、不等距分组
⑤选择分组的标志原则:
反映数据的本质特征;符合统计研究需要;结合现实历史条件。
次数分布的图示
直方图---等距分组
折线图(次数多变形图)---曲线图
茎叶图
四种常见曲线:
1.正态分布曲线---钟形曲线 例:所有的试验、测量和观测误差都服从正态分布。
2.偏态曲线:正偏(右偏)、负偏(左偏)。 例:人均收入。
3.J形曲线:正J形曲线、供给曲线-------倒J形曲线、需求曲线。
4.U形曲线:死亡率曲线、产品故障率曲线或浴盆曲线。
2.2分布集中趋势的测度
一、众数
1.含义:出现次数最多的变量数
2.特点:不受极限的影响;一个众数、多个众数也有可能。
3.近似公式:
M。=L+△1/(△1+△2)×i
L表示众数所在组的下组限;△1表示众数组次
文档评论(0)