新媒体数据分析与应用 微课版 第3章 新媒体数据的处理.ppt

新媒体数据分析与应用 微课版 第3章 新媒体数据的处理.ppt

  1. 1、本文档共31页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * 3.2.4 数据转换 数据记录方式的转换 使用查找、替换方式对数据记录方式进行转换的方法如下。 课后习题 1.处理缺失值的方式有哪些? 2.打开“素材文件\第 3 章\习题:近 15 天短视频数据统计.xlsx”,分别计算近 15 天短视频的点赞数、分享数、评论数的总和和平均值,计算结果如右图所示。 近15天短视频数据统计 3.打开“素材文件\第 3 章\习题:品牌直播推广数据统计.xlsx”,将数据表中的行列数据进行转换,转换后的效果如下图所示。 品牌直播推广数据统计 * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 新媒体数据的处理是指在分析数据之前,先对数据进行一定的清洗和加工,主要目的是清除异常数据、纠正错误数据等,以保证数据的准确性、完整性,这样得出的数据分析结果才更科学、更有参考价值。本章将详细介绍新媒体数据清洗、数据加工等方面的知识。 新媒体数据的处理 第3章 3.1 目录 CONTENTS 3.2 数据清洗 3.1 数据清洗是指发现并纠正数据文件中可识别的错误,包括检查数据一致性,处理无效值和缺失值等。新媒体运营者可以使用 Excel 来开展数据清洗工作。 3.1.1 缺失值的处理 缺失值是指数据集中某个或某些属性不完全的值。 缺失值产生的原因有很多,基本上可以分为机械原因和人为原因。 机械原因是指由于数据收集或保存失败造成的数据缺失。 人为原因主要是指由于历史局限、有意隐瞒或主观失误造成的数据缺失。 3.1.1 缺失值的处理 处理缺失值的方式 替换缺失值 某些缺失值可以从本数据源或其他数据源中推导出来,然后用样本平均值、中位数或众数代替缺失值。 还有一种方法,就是根据调查对象给出的其他问题的答案,通过分析变量间的相关性或逻辑关系进行推导与估算。 删除整个样本 删除整个样本,就是将含有缺失值的某个样本全部删除。这种方法只适合某个样本中缺失关键变量的情况,或者是含有无效值、缺失值的样本的重要性较低的情况。 删除变量 如果调查结果中某个变量的缺失值较多,且该变量在所研究的问题中所占的权重较小,就可以考虑删除该变量。 成对删除 成对删除是指不改变数据集中的全部变量和样本,而将其中的缺失值用一个特殊码(通常是 9、99、999 等)来表示。成对删除是一种比较保守的处理缺失值的方法,它能让样本中的可用数据得到最大限度的保留。 3.1.1 缺失值的处理 缺失值的查找与替换 在数据表中,缺失值最常见的表现形式就是空值或错误标识符,下面介绍使用 Excel 2016查找并替换缺失值的方法。 3.1.2 重复值的处理 重复值就是数据表中被重复输入的数据。 30天内某直播间各款商品的销量和销售额 3.1.2 重复值的处理 使用“删除重复项”功能查找并删除重复值 “删除重复项”是 Excel 2016 提供的数据去重功能,新媒体运营者使用这一功能可以快速删除重复项,方法如下。 3.1.2 重复值的处理 使用“排序”功能查找并删除重复值 使用 Excel 2016 的“排序”功能也可以查找重复值。使用这种方法查找到重复值后,新媒体运营者要先判断重复值是否有用,无用的重复值可以删除。例如,在统计人员信息时,可能会出现人名相同的情况,出现这种情况的原因可能是有的人同姓同名,也可能是重复录入,此时就需要新媒体运营者先进行判断,再对重复数据进行处理。 使用“排序”功能查找并删除重复值的方法如下。 3.1.2 重复值的处理 使用“条件格式”功能查找并删除重复值 使用 Excel 2016 的“条件格式”功能可以快速查找并标识出重复值。使用“条件格式”功能查找并删除重复值的方法如下。 3.1.3 数据逻辑性检查 数据逻辑性检查是指将不符合逻辑的数据查找出来,并采取合适的方法进行处理。 DOU+投放7日花费 3.1.3 数据逻辑性检查 使用“条件格式”检查数据逻辑性 使用“条件格式”检查数据逻辑性的方法如下。 3.1.3 数据逻辑性检查 使用函数检查数据逻辑性 下面使用 Excel 2016 中的 IF 函数判断数据的逻辑是否正确,方法如下。 数据加工 3.2 通过数据清洗环节,新媒体运营者找到并处理了数据中的错误值。接下来要根据数据分析的目的对数据进行加工,如对数据进行计算等,让数据更好地满足数据分析的需要。 3.2.1 数据计算 在数据表中,有些数据并不能直接从数据表中提取出来,而需要经过计算才能获得。 5款商品24小时的推广效果 3.2.1 数据计算 简单计算 简单计算就是对字段进行加、减、乘、除等简单计算,从而得到符合需求的数据。商品利润的计算公式为:利润=单价×销量-单件成本×销量-推广费用。根据利润计算公式,在 Excel 2016中计算

文档评论(0)

dllkxy + 关注
实名认证
内容提供者

本文库主要涉及建筑、教育等资料,有问题可以联系解决哦

版权声明书
用户编号:5213302032000001

1亿VIP精品文档

相关文档