- 1、本文档共19页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
商务数据处理
CONTENTS目录01数据清洗02数据转换03数据合并
01数据清洗
数据重复分为实体重复和字段重复。查找重复数据的方法有:条件格式法,通过标记颜色快速定位;数据透视表法,利用频次统计发现重复;高级筛选法,直接筛选不重复记录;函数法,使用COUNTIF函数精确计算重复次数。
例如,使用条件格式法可将重复编号标记为红色,方便识别。查找重复数据的方法查找重复数据后,保留唯一数据记录,删除其他重复数据。可通过筛选或直接删除重复行实现。
例如,通过数据透视表统计频次后,删除频次大于1的记录。删除重复数据在删除重复数据时,需确保保留能显示特征的唯一数据记录,避免丢失重要信息。
例如,对于商品信息,保留唯一商品编号对应的数据。保留唯一数据处理重复数据
找到缺失数据缺失数据包括记录缺失和字段信息缺失。可通过“查找和选择”功能定位空值。
例如,使用“查找和选择”中的“定位条件”选择“空值”,快速找到缺失数据。删除或插补缺失数据缺失数据处理方法有:删除记录、删除缺失值、缺失数据插补。插补方法包括均值插补、同类均值插补、极大似然估计、多重插补等。
例如,对于定距型数据,可使用均值插补填补缺失值。选择合适的处理方法根据数据类型和分析需求选择合适的处理方法。对于关键字段缺失,可考虑插补;对于非关键字段,可删除记录。
例如,对于客户年龄字段缺失,可使用均值插补。处理缺失数据
常用方法有:箱盒图、描述分析、散点图。箱盒图通过最小估计值和最大估计值判断异常值;描述分析查看极端值;散点图直观显示离群点。
例如,通过箱盒图可直观发现数据中的异常值。鉴别异常值分析异常值产生的原因,判断是“伪异常”还是“真异常”。对于“伪异常”,需结合业务背景理解其合理性。
例如,某商品销量突然增加,需结合促销活动判断是否为异常。分析异常值原因处理方法包括:删除异常值、不处理、视为缺失值、降低异常值权重。选择方法需考虑数据量和分析需求。
例如,对于少量异常值,可直接删除;对于大量异常值,可视为缺失值处理。处理异常值处理异常值
01使用函数检测逻辑错误,如COUNTIF、IF、OR函数。COUNTIF函数统计选项数;IF函数标记错误记录;OR函数检验条件。
例如,使用IF函数标记选项数大于3的记录为“错误”。检测逻辑错误修正后需验证结果是否符合逻辑和业务规则。可通过再次检测或人工审核验证。
例如,修正后使用OR函数再次检验,确保无逻辑错误。验证修正结果02修正逻辑错误需结合业务规则和数据背景。对于明显错误的数据,可直接修正;对于复杂错误,需进一步调查。
例如,对于客户年龄错误,需结合出生年份修正。修正逻辑错误03处理逻辑错误值
数据格式问题包括时间、日期、数值、半全角等格式不一致。可通过设置单元格格式或分列功能统一格式。
例如,将百分比格式统一为小数格式。字段中可能包含多余字符,如单位、空格等。可通过替换操作去除多余字符。
例如,去除身高字段中的“cm”字符。根据分析需求调整数据格式,如提取身份证中的出生年月。可使用MID、LEFT、RIGHT等函数提取数据。
例如,使用MID函数提取身份证中的出生年月。010203统一数据格式调整数据格式去除多余字符数据格式清洗
02数据转换
行列转换可通过“选择性粘贴”中的“转置”选项实现。适用于从不同维度观察数据。
例如,将时间维度数据转置为地区维度数据。数据转置对于多维度数据,可通过多次转置或使用数据透视表实现多维度转换。
例如,将时间、地区、产品维度数据转换为不同组合形式。多维度数据转换转置后需调整数据格式和标题,确保数据清晰易读。
例如,调整转置后的日期格式和列标题。转置后的数据调整行列转换
数值转字符可通过“分列”功能实现。适用于长数字或科学记数法数据。
例如,将手机号码转换为文本格式。数值转字符字符转数字可通过“分列”功能或直接转换实现。适用于文本格式的数字数据。
例如,将文本格式的销售额转换为数字格式。字符转数字文本日期转标准日期可通过“分列”功能或日期函数实现。适用于非标准日期格式数据。
例如,将“YYYYMMDD”格式日期转换为标准日期格式。文本日期转标准日期类型转换
添加排序条件数据排序可通过“排序”功能实现。可添加多个排序条件,如按访客数降序、下单买家数升序。
例如,将数据按访客数降序排列,再按下单买家数升序排列。自定义排序次序多字段排序自定义排序可通过“自定义序列”实现。适用于特定顺序的数据排序。
例如,按流量来源的自定义顺序排序。多字段排序可通过添加多个排序条件实现。适用于复杂数据排序需求。
例如,按地区、产品、时间等多个字段排序。数据排序
常规计算包括加、减、乘、除运算,以及使用函数计算统计指标,如AVERAGE、SUM等。
例如,计算成交转化率(成交客户数/访客数)。常规计算日期时间计算包括日期加减
您可能关注的文档
- 商务数据分析与应用 课件 项目八 商品采购分析与优化.pptx
- 商务数据分析与应用 课件 项目二 商务数据分析常用工具.pptx
- 商务数据分析与应用 课件 项目九 市场数据分析与应用.pptx
- 商务数据分析与应用 课件 项目六 用户画像与价值分析.pptx
- 商务数据分析与应用 课件 项目七 商品数据分析与运营优化.pptx
- 商务数据分析与应用 课件 项目三 商务数据采集.pptx
- 商务数据分析与应用 课件 项目十 商务数据分析报告撰写指南.pptx
- 商务数据分析与应用 课件 项目五 数据的可视化.pptx
- 商务数据分析与应用 课件 项目一 走进商务数据分析.pptx
- 新视野大学英语(第四版)读写教程2(思政智慧版)B2U4Section B.pptx
- 新视野二版听说1第6单元示范1课件.ppt
- 【参考答案】 联络口译(第二版) 《联络口译》(第二版)参考答案.pdf
- 梅大高速茶阳路段“5·1”塌方灾害调查评估报告.docx
- 虹吸雨水PE管施工节点标准做法.pdf
- 2025消防设施施工质量常见通病防治手册,典型图示+规范要求.pptx
- 新视野大学英语(第二版)读写教程 4 空军工程大学编U05B.ppt
- E英语教程2(智慧版)Unit 6.pptx
- E英语教程3(智慧版)Unit 7.ppt
- 新视野二版读写1第4单元课件Section A How to Make a Good Impression.pptx
- E英语视听说教程4(智慧版)4-U2课件(2024版)U2.pptx
文档评论(0)