网站大量收购独家精品文档,联系QQ:2885784924

商务数据分析与应用 课件 项目四 商务数据处理.pptx

商务数据分析与应用 课件 项目四 商务数据处理.pptx

  1. 1、本文档共19页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

商务数据处理

CONTENTS目录01数据清洗02数据转换03数据合并

01数据清洗

数据重复分为实体重复和字段重复。查找重复数据的方法有:条件格式法,通过标记颜色快速定位;数据透视表法,利用频次统计发现重复;高级筛选法,直接筛选不重复记录;函数法,使用COUNTIF函数精确计算重复次数。

例如,使用条件格式法可将重复编号标记为红色,方便识别。查找重复数据的方法查找重复数据后,保留唯一数据记录,删除其他重复数据。可通过筛选或直接删除重复行实现。

例如,通过数据透视表统计频次后,删除频次大于1的记录。删除重复数据在删除重复数据时,需确保保留能显示特征的唯一数据记录,避免丢失重要信息。

例如,对于商品信息,保留唯一商品编号对应的数据。保留唯一数据处理重复数据

找到缺失数据缺失数据包括记录缺失和字段信息缺失。可通过“查找和选择”功能定位空值。

例如,使用“查找和选择”中的“定位条件”选择“空值”,快速找到缺失数据。删除或插补缺失数据缺失数据处理方法有:删除记录、删除缺失值、缺失数据插补。插补方法包括均值插补、同类均值插补、极大似然估计、多重插补等。

例如,对于定距型数据,可使用均值插补填补缺失值。选择合适的处理方法根据数据类型和分析需求选择合适的处理方法。对于关键字段缺失,可考虑插补;对于非关键字段,可删除记录。

例如,对于客户年龄字段缺失,可使用均值插补。处理缺失数据

常用方法有:箱盒图、描述分析、散点图。箱盒图通过最小估计值和最大估计值判断异常值;描述分析查看极端值;散点图直观显示离群点。

例如,通过箱盒图可直观发现数据中的异常值。鉴别异常值分析异常值产生的原因,判断是“伪异常”还是“真异常”。对于“伪异常”,需结合业务背景理解其合理性。

例如,某商品销量突然增加,需结合促销活动判断是否为异常。分析异常值原因处理方法包括:删除异常值、不处理、视为缺失值、降低异常值权重。选择方法需考虑数据量和分析需求。

例如,对于少量异常值,可直接删除;对于大量异常值,可视为缺失值处理。处理异常值处理异常值

01使用函数检测逻辑错误,如COUNTIF、IF、OR函数。COUNTIF函数统计选项数;IF函数标记错误记录;OR函数检验条件。

例如,使用IF函数标记选项数大于3的记录为“错误”。检测逻辑错误修正后需验证结果是否符合逻辑和业务规则。可通过再次检测或人工审核验证。

例如,修正后使用OR函数再次检验,确保无逻辑错误。验证修正结果02修正逻辑错误需结合业务规则和数据背景。对于明显错误的数据,可直接修正;对于复杂错误,需进一步调查。

例如,对于客户年龄错误,需结合出生年份修正。修正逻辑错误03处理逻辑错误值

数据格式问题包括时间、日期、数值、半全角等格式不一致。可通过设置单元格格式或分列功能统一格式。

例如,将百分比格式统一为小数格式。字段中可能包含多余字符,如单位、空格等。可通过替换操作去除多余字符。

例如,去除身高字段中的“cm”字符。根据分析需求调整数据格式,如提取身份证中的出生年月。可使用MID、LEFT、RIGHT等函数提取数据。

例如,使用MID函数提取身份证中的出生年月。010203统一数据格式调整数据格式去除多余字符数据格式清洗

02数据转换

行列转换可通过“选择性粘贴”中的“转置”选项实现。适用于从不同维度观察数据。

例如,将时间维度数据转置为地区维度数据。数据转置对于多维度数据,可通过多次转置或使用数据透视表实现多维度转换。

例如,将时间、地区、产品维度数据转换为不同组合形式。多维度数据转换转置后需调整数据格式和标题,确保数据清晰易读。

例如,调整转置后的日期格式和列标题。转置后的数据调整行列转换

数值转字符可通过“分列”功能实现。适用于长数字或科学记数法数据。

例如,将手机号码转换为文本格式。数值转字符字符转数字可通过“分列”功能或直接转换实现。适用于文本格式的数字数据。

例如,将文本格式的销售额转换为数字格式。字符转数字文本日期转标准日期可通过“分列”功能或日期函数实现。适用于非标准日期格式数据。

例如,将“YYYYMMDD”格式日期转换为标准日期格式。文本日期转标准日期类型转换

添加排序条件数据排序可通过“排序”功能实现。可添加多个排序条件,如按访客数降序、下单买家数升序。

例如,将数据按访客数降序排列,再按下单买家数升序排列。自定义排序次序多字段排序自定义排序可通过“自定义序列”实现。适用于特定顺序的数据排序。

例如,按流量来源的自定义顺序排序。多字段排序可通过添加多个排序条件实现。适用于复杂数据排序需求。

例如,按地区、产品、时间等多个字段排序。数据排序

常规计算包括加、减、乘、除运算,以及使用函数计算统计指标,如AVERAGE、SUM等。

例如,计算成交转化率(成交客户数/访客数)。常规计算日期时间计算包括日期加减

文档评论(0)

balala11 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档