- 78
- 0
- 约2.98千字
- 约 39页
- 2018-11-01 发布于河北
- 举报
数据分析基础课程-第3章--数据的处理
目录/Contents;3.1 数据清洗;; 图3-2 选择C列;(3)在“查找和替换”对话框的“查找内容”中输入“cm”,设置“替换为”为空,单击“全部替换”按钮完成替换,如图3-4所示。
替换后的结果如图3-5所示。
;3.1.2 缺失数据的处理
数据清单中,单元格如果出现空值,就认为数据存在缺失。缺失数据的处理方法通常有以下3种:
? 用样本均值(或众数、中位数)代替缺失值;
? 将有缺失值的记录删除;
? 保留该记录,在要用到该值做分析时,将其临时删除(最常用方法)。;首先来解决如何发现缺失数据,仅靠眼睛来搜索缺失数据显然是不现实的,一般我们用“定位条件”来查找缺失数据的单元格。下面演示将“年龄”字段中的空值均替换为“18”。
(1)选择“年龄”所在的E列。
(2)选择“查找和选择”|“定位条件”命令,如图3-6所示。
(3)在“定位条件”对话框中,选中“空值”单选项,如图3-7所示。;(4)单击“确定”按钮后,E列所有的空白单元格呈选中状态,如图3-8所示。
(5)输入替代值“18”,按Ctrl+Enter组合键确认,结果如图3-9所示。
;3.1.3 删除重复记录
删除重复记录的操作极其简单,只需单击数据表的任意位置,再单击“数据”|“删除重复项”按钮即可,如图3-10所示。
;3.2 数据加工; 3.2.2 字段分列
(1)选择“字段分列”工作表的A
原创力文档

文档评论(0)