- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第一章 统计和统计数据
名词解释
统计学:收集处理分析解释数据并从数据中得出结论的科学。
描述统计:研究数据收集处理汇总图表描述概括与分析等统计方法。
推断统计:研究如何利用样本数据来推断总体特征的统计方法。
分类数据:只能归于某一类别的非数字型数据。
顺序数据:只能归于某一有序类别的非数字型数据。
数值型数据:按数字尺度测量的观察值。
总体:包含所研究的全部个体(数据)的集合。
样本:从总体中抽取的一部分元素的集合。
参数:用来描述总体特征的概括性数字度量。
变量:说明现象某种特征的概念。
分类变量:说明事物类别的一个名称。
顺序变量:说明事物有序类别的一个名称。
数值型变量:说明事物数字特征的一个名称。
概率抽样:随机抽样,遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。
非概率抽样:不随机,根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。
简单随机抽样:从包括总体的 N个单位的抽样框中随机,一个个抽取n个单位作为样本,每单位等概论。
分层抽样:将抽样单位按某种特征或某种规则划分为不同的层,然后从不同层中独立、随机地抽取样本。
整群抽样:总体中若干单位合并为组,群,抽样时直接抽取群,然后对中选群中的所有单位全部实施调查。
系统抽样:总体中所有单位按顺序排列,在规定范围内随机抽取一单位作为初始单位,然后按事先规则确定其
它样本单位。
抽样误差:由于抽样的随机性引起的样本结果与总体真值之的误差
简答题。
1. 概率抽样与非概率抽样比较: 性质不同,非概不依据随机原则选样本,样本统计量分布不确切,无法使用样本的结果对总体相应参数进行推断。操作简便,时效快,成本低,专业要求不很高。概率抽样依
据随机原则抽选样本,理论分布存在,对总体有关参数可进行估计,计算估计误差,得到总体参数的置信区间。提出精度要求。
数据收集方法的选择: 抽样框中有关信息,目标总体特征,调查问题的内容,有形辅助物的使用,实施调查的资源,管理与控制,质量要求
误差的控制: 抽样误差是抽样随机性带来的,不可避免可以计算,改大样本量。选择合适改进的抽样框,设计好的调查问卷,调查过程的质量控制。
第二章 用图表展示数据。
名词解释
频数:落在某一特定类别或组中的数据个数。
频数分布:各个类别及其相应的频数形成的分布。
比例:一个样本(或总体)中各个部分的数据占全部数据比值。
比率:一个样本(或总体)中各不同类别数据之间的比值。
组距 :是一个组的上限与下限的差
组距分组:是将全部变量依次划分为若干个区间,将这一区间的变量值作为一组。
组中值=下限值 +上限值 /2 上下限的中间值
直方图:用矩形的宽度和高度(即面积)来表示频数分布的图形。
茎叶图:由茎和叶两部分组成的、反应原始数据分布的图形。
10. 箱线图:由一组数据的最大值、最小值、中位数和两个四分位数 5个特征值绘制而成的、反应原始数据分布图形。
简答题。
数据透视表作用: 可以对数据表重要信息按使用者的习惯或分析要求进行汇总和作图,形成一个符合
需要的交叉表
2. 数据分布表的制作步骤:
3. 直方图与条形图的差别:
确定组数,确定组距,根据分组整理成频数分布表,上组限不在内不重不漏首先条形图是用条形的长度表示各类别频数的多少,宽度是固定的;直方图
用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,高宽均有意义。其次由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。最后
条形图主要用于展示分类数据,直方图主要用于展示数值型数据。
4. 茎叶图与直方图的区别: 茎叶图既能给出数据的分布情况,又能保留原始数据的信息。直方图通常适用于批量数据,茎叶图小批量数据。
饼图与环形图差别:环形图中空洞,样本或总体中每一部分用环中的一段表示。饼图只能显示一个样本
或总体各部分所占的比例 ,环形图可以同时绘制多个,有利比较研究。
好图形具备特征: 显示数据,读者注意集中图形内容,避免歪曲,强调数据之间比较,服务明确目的,对图形统计描述与文字说明。
图形优劣准则: 好图应当使复杂的观点简明、确切、高效阐述,最短时间内以最少的笔墨给读者提大信息,多维,表述数据真实情况。
制作统计表设计注意: 合理安排表结构,包括表号总标题单位,上下两横线粗,中间细,必要注释、来源。
第三章 用统计量描述数据。
名词解释
众数:一组数据中出现频数最多的数值
中位数:一组数据排序后处于中间位置上的数值。
四分位数:一组数据排序后处在25%和 75%位置上的数值。
平均数:又称均值,是全部数据的算术平均值
四分位差: 75%位置上的四分位数与 25%位置上的四分位数之差。顺序数据。
极差:也称全距,一组数据的最大值与最小值之差。
您可能关注的文档
- (完整word版)统计学公式汇总.docx
- (完整word版)统计学原理教学总结.docx
- (完整word版)统计学复习精要(贾俊平版).docx
- (完整word版)统计学开题报告.docx
- (完整word版)统计学理论与方法研究.docx
- (完整word版)统计学贾俊平课后答案目前最全.docx
- (完整word版)继电保护和安全自动装置技术规程题(共157题).docx
- (完整word版)继电保护试题A.docx
- (完整word版)绩效考核外文文献及翻译.docx
- (完整word版)维修电工人员个人工作总结.docx
- 四川省德阳市罗江中学2025届高三考前热身化学试卷含解析.doc
- 山东省枣庄现代实验学校2025届高三下学期第五次调研考试化学试题含解析.doc
- 吉林省长春市十一高中等九校教育联盟2025届高三一诊考试生物试卷含解析.doc
- 2025届江苏省盐城市伍佑中学高考仿真模拟化学试卷含解析.doc
- 2025届广西贺州中学高考冲刺押题(最后一卷)生物试卷含解析.doc
- 安徽省池州市贵池区2025届高三第一次模拟考试生物试卷含解析.doc
- 宁夏银川一中2025届高三(最后冲刺)化学试卷含解析.doc
- 广东省广州市增城区四校联考2025届高考压轴卷化学试卷含解析.doc
- 2025届邯郸市第一中学高考生物必刷试卷含解析.doc
- 2025届安徽省安庆市石化第一中学高考仿真卷化学试卷含解析.doc
文档评论(0)