- 1
- 0
- 约1.49千字
- 约 18页
- 2022-06-13 发布于广东
- 举报
课程结构
第1章 数据分析概述
第2章 数据处理
第3章 数据可视化分析
第4章 数据的描述分析
第5章 推断分析基本方法
第6章 相关与回归分析
第7章 时间序列分析;;学习目标
了解数据审核的内容
掌握频数分布表的生成方法
掌握数值数据类别化方法
使用Excel的生成频数分布表
思政目标
数据处理是数据分析的前期工作。在数据处理过程中要本着实事求是的态度,避免为达到个人目的而有意加工和处理数据
数值数据分组的目的是通过数据组别对实际问题进行分类,分组的应用要反映社会正能量,避免利用不合理的分组歪曲事实;数据审核就是检查数据中是否有错误
对于通过调查取得的原始数据(raw data),主要从完整性和准确性两个方面去审核。完整性审核主要是检查应调查个体是否有遗漏,所有的调查项目是否填写齐全等。准确性审核主要是检查数据是否有错误,是否存在异???值等
对于通过其他渠道取得的二手数据,应着重审核数据的适用性和时效性
应弄清楚数据的来源、数据的口径以及有关的背景材料,以便确定这些数据是否符合自己分析研究的需要,不能盲目生搬硬套
还要对数据的时效性进行审核,对于有些时效性较强的问题,如果所取得的数据过于滞后,可能失去了研究的意义;数据录入就是生成电子数据文件
用Excel进行数据验证
第1步:用鼠标在工作表中选定录入数据的单元格区域,如A1:B10单元格区域
第2步:选择【数据】→【数据验证】
第3步:在【验证条件】的【允许】框内选择要录入的数据类型,比如,“整数”(默认为任何值)。在【介于】框内选择验证条件,或者在“最小值”和“最大值”框内输入数据范围。比如,在【最小值】框内输入0,在【最大值】框内输入100。出现的界面如下图所示
第4步:点击【出错警告】,在【式样】下选择“警告”,在【错误信息】下输入警告信息,比如“NA”。然后点击【确定】,即可完成设置
完成上述设置后,在此区域内录入不符合验证条件的数据将会出现以下错误信息。比如,在A1单元格录入1000,显示的错误信息。选择【是】,忽略此错误,选择【否】则返回单元格,再重新录入;?;【例2-1】表2-1是50个学生的学生编号、性别、专业和考试分数数据。按考试分数降序排列
第1步:将光标放在数据区域的任意单元格。然后点击【数据】?【排序】
第2步:在【主要关键字】框中选择要排序的变量,本例为“考试分数”,在【次序】中选择降序(默认为升序),然后点击【确定】(如果要专业排序,点击【选项】,在【方法】下选中“字母排序”或“笔划排序”);数据筛选(data filter)是根据需要找出符合特定条件的某类数据; 数据排序与筛选——数据筛选——例题分析(例2-2);频数(frequency)——落在某一特定类别(或组)中的数据个数
频数分布(frequency distribution)——把各个类别及落在其中的相应频数全部列出,并用表格形式表现出来
由于类别数据本身就是用文字表达的类别,因此,只要先把所有的类别都列出来,然后计算出每一类别的频数,即可生成一张频数分布表
频数分布表中落在某一特定类别的数据个数就是频数
根据观察变量的多少,可以生成简单频数表、二维列联表和多维列联表等; 类别数据的频数分布表——简单频数表——例题分析; 类别数据的频数分布表——二维列联表——例题分析; 类别数据的频数分布表——频数表的简单分析——例题分析; 数值数据的频数分布表——例题分析; 数值数据的频数分布表——例题分析; 数值数据的频数分布表——例题分析;思维导图; THANKS
原创力文档

文档评论(0)