- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
电子商务数据分析基础模块三 数据分类与处理
CONTENT目录单元一 认识数据分类与处理单元二 分类统计单元三 数据处理单元四 数据计算
单元三 数据处理
引导案例某电器官方旗舰店于2022年8月份参加了一期聚划算活动,因折扣力度大,推广效果极好。活动结束后,该企业将后台销售数据导出,交给数据分析部门,进行此次活动的效果追踪评价。数据分析师拿到数据经过整理后,发现该源数据存在如图所示的质量问题。
引导案例为了保证数据分析结果的准确性,数据分析师先对该源数据进行了处理,修正了错误数据,统一了日期格式,处理了缺失内容,又将混杂在一起的数据分开,为之后的数据计算和数据分析做好了准备。结合案例,思考并回答以下问题:(1)在图3-22中,处理完成后的数据是怎样的?(2)在电商运营中,除了案例中存在的数据质量问题,还需要进行哪些问题的数据处理?
单元三 数据处理一、数据清洗数据清洗是指将数据表中多余、重复的数据筛选出来并删除,将缺失、不完整的数据补充完整,将内容、格式错误的数据纠正或剔除的操作行为。数据清洗是对数据进行重新审查和校验的过程,目的在于提升数据的质量,确保数据的准确性、完整性和一致性。缺失值清洗格式内容清洗逻辑错误清洗重复数据清洗无价值数据清洗
单元三 数据处理缺失值清洗数据集中某个或某些属性的值是不完整的。缺失值产生的原因有些信息无法获取,如在收集顾客婚姻状况和工作信息时,未婚人士的配偶、未成年儿童的工作单位等都是无法获取的信息。数据收集或者保存失败造成数据缺失,如数据存储的失败、存储器损坏、机械故障等。人为原因导致的某些信息被遗漏或删除。
单元三 数据处理空值清洗打开原始数据表格,选中数据区域,在“开始”选项卡下的“编辑”功能组中单击“查找和选择”按钮,点击“定位条件”命令,在弹出的“定位条件”对话框中选中“空值”,点击“确定”后,所有的空值即可被一次性选中。1
单元三 数据处理定位到空白值后,可以选择“数据补齐”、“删除记录”或者“不处理”。如需数据补齐,则直接输入需要补充的内容,按“Ctrl+Enter”组合键,进行批量填充。2
单元三 数据处理知识链接处理缺失值的三种方法:(1)数据补齐。即使用某个统计指标填充缺失数据,如该变量的样本平均值等。(2)删除记录。将有缺失值的记录删掉,但这样会导致样本量减少,数据量较少时应谨慎使用。(3)不处理。样本较少时,或者该数据缺失属正常情况时,不做处理。
单元三 数据处理错误标识符清洗######DIV/0!单元格中的数据超出了该单元格的宽度,或者单元格中的日期时间公式产生了一个负值进行公式运算时除数使用了数值零、指向了空单元格或包含零值单元格的引用如图,由于2022年7月5日所采购的商品还未采集到因不合格而产生退货的数量,因此在计算退货率时,发生了“#VALUE!”的错误。
单元三 数据处理将鼠标定位在出现“I12”单元格中,在公式编辑栏中,修改原公式“=H12/E12”为“=IFERROR(H12/E12,/)”1
单元三 数据处理确认输入后,“I12”单元格中的“#VALUE!”被修改为“/”,然后拖动“I12”单元格的填充柄,将其他发生错误的单元格进行填充修改2
单元三 数据处理格式内容清洗由于系统导出渠道或人为输入习惯的原因,整合而来的原始数据往往不能做到格式统一,内容上也容易出现空格。“订单创建时间”列出现了四种不同的表达方式,“物流公司”列的字符前面或中间存在空格,需要将其修正。
单元三 数据处理选中“订单创建时间”整列,右击打开弹出式菜单,单击“设置单元格格式”选项,在弹出的“设置单元格格式”对话框中,选择“数字”选项卡,单击“日期”,将其类型修改为如图所示的样式。单击“确定”完成。1
单元三 数据处理“物流公司”列数据中的空格可以使用“替换”一次性批量去除。选中数据区域,在“开始”选项卡下的“编辑”功能组中单击“查找和替换”按钮,单击“替换”命令,在“查找内容”中输入一个空格,在“替换为”中不输入任何内容,单击“全部替换”即可全部删除表格中的空格。2
单元三 数据处理逻辑错误清洗违反逻辑规律的要求和逻辑规则而产生的错误,一般使用逻辑推理就可以发现问题。123数据不合理数据自相矛盾数据不符合规则如客户年龄500岁,或者消费金额为-100元,明显不符合客观事实。如客户的出生年份是1980年,但年龄却显示18岁。如限购1件的商品,客户的购买数量却为3件。
单元三 数据处理“多彩橡皮泥套盒”商品的订单表
单元三 数据处理由于该商品限购1件,因此需要将“购买数量”大于1的记录标注出来。选中“购买数量”列,选择“开始”选项卡—“样式”功能组—“条件格式”—“突出显示单元格规格”—“大于”,在弹出的“大于”对话框中,填入数值“1”,单击“确定”,即可将错误数据标注出来。1
单
您可能关注的文档
- 电子商务数据分析基础(高教第二版)模块二-习题+答案.docx
- 电子商务数据分析基础(高教第二版)模块三-习题+答案.docx
- 电子商务数据分析基础(高教第二版)模块四-习题+答案.docx
- 电子商务数据分析基础(高教第二版)模块一-习题+答案.doc
- 电子商务数据分析基础(高教第二版)课件 (模块二)单元二 数据采集的渠道及工具.pptx
- 电子商务数据分析基础(高教第二版)课件 (模块二)单元三 市场数据采集.pptx
- 电子商务数据分析基础(高教第二版)课件 (模块二)单元四 运营数据采集.pptx
- 电子商务数据分析基础(高教第二版)课件 (模块二)单元五 产品数据采集.pptx
- 电子商务数据分析基础(高教第二版)课件 (模块二)单元一 数据采集认知.pptx
- 电子商务数据分析基础(高教第二版)课件 (模块三)单元二 分类统计.pptx
最近下载
- 02S701 砖砌化粪池建筑工程图集 .docx VIP
- 旅游度假区目标客户群分析.docx VIP
- TCBDA 27-2019 建筑装饰装修机电末端综合布置技术规程.pdf VIP
- 《飞机构造基础》课件——第九章 飞机防火系统.pptx VIP
- 中信泰富:2008年年度报告.pdf
- 《飞机构造基础》课件——第二章 重量与平衡.pptx VIP
- 医院绩效考核分配方案及实施细则.pdf VIP
- 旅游市场的目标客户群分析与定位.docx VIP
- D-Z-T 0204-2022 矿产地质勘查规范 稀土(正式版).docx VIP
- 2025初中七年级数学下册《相交线与平行线》大单元整体教学设计.docx
文档评论(0)