- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《统计复习资料
统计学复习资料
第一章 导论
1.统计学:是收集、处理、分析、解释数据并从数据中得出结论的科学。
2.统计方法:描述统计和推断统计(参数统计和假设检验)。
3.统计数据的分类:A.按计量层次:分类数据、顺序数据、数值型数据。
B.按收集方法:观察数据、实验数据。
C.按时间状况:截面数据、时序数据。
4.总体:所研究的全部个体(数据)的集合,其中的每个个体也称为元素。(分为有限总体和无限总体)
样本:从总体中抽取的一部分元素的集合。
参数:描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值。(总体均值υ、标准差σ、总体比列π)
统计量:用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数(样本均值 、样本标准差 、样本比列 )
变量:说明现象某种特征的概念(分为分类变量、顺序变量、数值型变量)
第二章 数据的收集
1.概率抽样:也称随机抽样。
特点:按一定的概率以随机原则抽取样本;
每个单位被抽中的概率是已知的,或是可以计算出来的;
当用样本对总体目标进行估计时,要考虑到每个样本单位被抽中的概率。
方式:简单随机抽样、分层抽样、整群抽样、系统抽样、多阶段抽样
2.非概率抽样:相对于概率抽样而言。抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。
方式:方便、判断、自愿、滚雪球、配额抽样等方式。
3.收集数据的基本方法:A.调查的数据:自填式、面访式、电话式
B.实验的数据
4.各调查方法的比较:
自填式 面访式 电话式 调查时间 慢 中等 快捷 调查费用 低 高 低 问卷难度 要求容易 可以复杂 要求容易 有形辅助物的使用 中等利用 充分利用 无法利用 调查过程控制 简单 复杂 容易 调查员作用的发挥 无法发挥 充分发挥 一般发挥 回答率 最低 较高 一般
5.抽样误差:由抽样的随机性所带来的误差
影响其误差大小的因素:样本量的大小、总体的变异性
6.非抽样误差:除抽样误差之外的,由于其他原因造成的样本观察结果与总体真值之间的差异,存在于所有的调查之中(概率抽样、非概率抽样、全面性调查)
第四章 数据的概括性度量(计算题)
1.众数(主要适用于分类数据的测度,也可适用于顺序和数值型数据):数据中出现次数最多的变量值;不受极端值影响;
2.中位数:主要用于顺序数据,也可用于数值型数据,但不能用于分类数据;
3.四分位数:顺序数据
4.平均数:也称均值,数值型数据,可分为简单、加权、几何平均数
5.众数、中位数、平均数的特点和应用
A.众数:不受极端值影响;具有不唯一性;数据分布偏斜程度较大且有明显峰值时应用
B.中位数:不受极端值影响;数据分布偏斜程度较大时应用
C.平均数:易受极端值影响;数学性质优良;数据对称分布或接近对称分布时应用
6.众数、中位数和平均数的关系:(简答题)
如果数据的分布是对称的,众数、中位数和平均数必定相等
如果数据是左偏分布,说明数据存在极小值,必然拉动平均数向极小值一方靠,而众数和中位数由于是位置代表值,不受极值的影响,因此三者关系表现为:平均值小于中位数小于众数
如果数据右偏分布,说明数据存在极大值,必然拉动平均数向极大值一方靠,则众数小于中位数小于平均数
7.离散程度的度量
A.异众比率(分类数据):对分类数据离散程度的测度,非众数组的频数占总频数的比列;用于衡量众数的代表性
B.四分位差(顺序数据):对顺序数据离散程度的测度,也称内距或四分间距(掌握计算);反应中间50﹪数据的离散程度,不受极端值影响;用于衡量中位数的代表性
C.方差和标准差(计算):数据离散程度的最常用测度值;反映各变量值与均值的平均差异;根据总体数据计算的,称为总体方差,记为 ;根据样本数据计算的称为样本方差
计算公式:
8.自由度:是指数据个数与附加给独立的观测值得约束或限制的个数之差(如果对n个观测值附加的约束个数为k个,自由度则为n-k)
9.相对位置的度量:标准分数
标准分数也称标准比值;对某一值在一组数据中相应位置的度量;可用来判断一组数据是否有离群点;用于对变量的标准化处理
10.切比雪夫不等式:如果一组数据不是对称分布,经验法则就不在适用,这时可使用切比雪夫不等式,它对任何分布形状的数据都适用;它提供的是“下界”,也就是“所占比列至少是多少”;对于任意分布形态的数据,根据它,至少有1-1/k2的数据落在平均数加减k个标准差之内,其中k是大于1的任意值,但不一定是整数。
P102不等式含义自看
1
您可能关注的文档
- 《德语固定搭配.docx
- 《给有手机方面渠道的或者对手机行业感兴趣的朋友带来一个不错的机会.doc
- 《给李区长汇报红旗工业园简介.doc
- 《德语学习资料内含各种所需.docx
- 《德语恋爱情话表达.doc
- 《德语报刊选读功能动词.doc
- 《给材料作文写作提示及精彩例文赏析.doc
- 《德语被动语态.doc
- 《给材料写议论文指导之一.doc
- 《德语词汇大学院系科系种类及手机用语.doc
- 【西班牙投资促进局】英文2024年西班牙农业食品技术873mb.pptx
- 【中国农业大学】2024北京市高校食堂食物浪费现状及转型策略报告732mb.pptx
- 【联合国粮食及农业组织】传粉者挑战徽章训练手册中18228mb.pptx
- 【联合国粮食及农业组织】粮食和农业植物遗传资源种质库标准实施实用指南—种质库正常型种子保存8117mb.pptx
- 【世界银行】加强巴伊亚州的农业支持:建立有竞争力、绿色和包容性的农业食品部门的政策2025643mb.pptx
- 【FAO】2024年粮食及农业状况报告.pptx
- 20242025年互联网农业市场现状调研及前景趋势预测报告1081mb.pptx
- 20242025年现代农业市场现状调研及前景趋势预测报告1141mb.pptx
- 辽宁省首饰产品质量监督抽查实施细则.docx
- 数字农业产业项目整体解决方案9126mb.pptx
最近下载
- 古代画中的仕女图10幅.pdf VIP
- 高校教师岗前培训题库高等教育学.pdf VIP
- 2024年新高考全国Ⅰ卷数学试卷试题真题答案详解(精校打印).docx VIP
- 苏科版九年级上册物理课件 二、电路连接的基本方式 2节 电路连接的基本方式.pptx VIP
- T_CCTAS 157-2024 陆路交通基础设施隧道智能设计数字化技术规范.docx
- 中心静脉导管并发症处理.pptx VIP
- 52个奥数解题方法.pdf VIP
- 2024年新人教版英语三年级上册课件 Unit 4 Part A 第1课时.pptx VIP
- 监测设备、报警仪器和辐射防护用品登记表.docx VIP
- 22rum猜想想要读写快还是存储省又三选二.pdf VIP
文档评论(0)