- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
第2章
电商数据收集与预处理电商数据分析(微课版)
目录CONTENTS2.1电商数据的收集2.2使用Excel预处理数据2.3使用讯飞星火预处理数据综合实训——清洗收集的女装商品数据
2.1.1电商数据的收集原则3●合法性原则数据的收集必须遵守相关的法律法规,确保在合法的范围内进行,维护个人隐私权和其他权益。●精确性原则确保收集到的数据准确、完整,以提高数据质量及其可信度。●及时性原则数据收集需要尽可能地获取新近的数据,只有确保数据的及时性,才能更好地发现当前的问题并预测未来变化趋势。如果收集10年前某个市场的数据来分析该市场当下的发展情况,则无法得到有价值的分析结果。要想收集到有价值的数据,我们需要遵循一定的数据收集原则,具体包括合法性原则、精确性原则和及时性原则。
2.1.2电商数据的收集渠道4●内部数据的收集渠道内部数据指的是商家内部的各种管理系统产生的数据,如商品采购和管理系统产生的数据、消费者服务管理系统产生的数据等。●外部数据的收集渠道外部数据即非商家内部产生的数据,它包括市场调查数据和网络数据两大类。右图所示为国家统计局公开发布的数据。电商数据的收集渠道较多,为了便于学习,这里将电商数据的收集渠道划分为内部数据的收集渠道与外部数据的收集渠道。
2.1.3电商数据的收集方法5●复制问目标网页,选择需要收集的数据内容,在所选数据上单击鼠标右键,在弹出的快捷菜单中选择“复制”命令,或直接按【Ctrl+C】组合键。●下载如果网页中提供有“下载”“导出”等功能按钮,则无须手动复制数据,需单击相应的按钮,然后按照提示将数据保存到计算机上的指定位置即可。如上图所示。针对不同的收集渠道,电商数据的收集方法也各有不同。主要的收集方法则包括以下3种。●爬取爬取数据是指利用工具自动收集网站上的数据,这对于数据较为分散且网站未提供下载、导出功能的情况来说是非常实用的。
6本案例将使用八爪鱼采集器在京东商城中采集智能数码用品数据,其具体操作如下。1选择数据的采集方式2设置并保存采集任务使用的网址课堂案例——使用八爪鱼采集器采集智能数码用品数据2.1.3电商数据的收集方法
73开启浏览模式并输入登录信息4单击“自动识别网页内容”超链接2.1.3电商数据的收集方法课堂案例——使用八爪鱼采集器采集智能数码用品数据
85显示的采集的数据内容6单击“保存并开始采集”超链接2.1.3电商数据的收集方法课堂案例——使用八爪鱼采集器采集智能数码用品数据
97采用本地采集模式8正在采集数据10导出数据9停止采集2.1.3电商数据的收集方法课堂案例——使用八爪鱼采集器采集智能数码用品数据
1011去重数据12设置数据导出的文件类型2.1.3电商数据的收集方法课堂案例——使用八爪鱼采集器采集智能数码用品数据
1113设置保存的文件名和保存位置2.1.3电商数据的收集方法课堂案例——使用八爪鱼采集器采集智能数码用品数据
目录CONTENTS2.1电商数据的收集2.2使用Excel预处理数据2.3使用讯飞星火预处理数据综合实训——清洗收集的女装商品数据
2.2.1数据预处理的价值13数据预处理就是对数据进行粗加工。一般来说,收集到的电商数据往往都存在一些问题,需要经过预处理,才能用于后期分析。数据预处理的价值大致如下。将繁杂的数据简单化,提升数据分析效率与决策效果将数据转化为论据,系统、客观地反映实际情况将数据整合为信息资源,实现深度挖掘
2.2.2数据预处理的原则14数据预处理可以为数据分析提供更加精准的数据,可以简化数据分析的工作内容。为了更好地进行数据预处理工作,需参考以下一些原则。●客观性原则●完整性原则●严谨性原则●针对性原则●便捷性原则
2.2.3数据预处理的方法15当收集的数据中存在缺失数据时,应根据实际情况采取不同的方式进行处理。1.处理缺失数据删除缺失数据:当收集到的数据量很大,使得即便删除若干数据也不会影响数据样本的数量时,就可以采取删除的方式处理缺失数据。修补缺失数据:如果能够判断出缺失数据的内容,则应该及时修补缺失数据;如果无法判断,则可以考虑使用平均数、众数(一组数据中出现次数最多的数据)等合理的方法预测缺失数据。但切记不能为了补全数据而随意填写,造成数据失真。
2.2.3数据预处理的方法16本案例利用快速定位的方法,将智能数码用品店铺收集到的流量类型数据中的缺失流量类型数据补全,其具体操作如下。课堂案例——补全智能数码用品店铺的流量类型数据1定位空值2补全空值后的效果1.处理缺失数据
2.2.3数据预处理的方法17对于一些明显错误的数据,Excel会显示错误信息,以提醒用户及时对错误数据进
您可能关注的文档
- 电商数据分析(微课版)-PPT课件 (3).pptx
- 电商数据分析(微课版)-PPT课件 (10).pptx
- 订单明细数据分析.xlsx
- 使用Excel分析订单明细数据操作.pdf
- 女装子行业数据波士顿矩阵分析.xlsx
- RFM模型数据分析.xlsx
- 漏斗图数据分析结果.xlsx
- 2025年HRSaaS普及与数据安全风险管理.docx
- 《2025年文旅地产资本运作:乡村文化IP赋能项目开发机遇评估》.docx
- 《2025年在线教育行业报告:OMO模式深化如何提升学习体验质量》.docx
- 《2025年公共卫生应急报告:AI疫情预测与资源调配模型》.docx
- 《再生金属行业2025年政策环境循环经济发展策略研究》.docx
- 2025年开源生态AI大模型技术创新与产业协同趋势.docx
- 《2025年智能汽车人机交互创新研究》.docx
- 2025年专利申请增长趋势下的知识产权保护机制创新分析报告.docx
- 《2025年数字藏品元宇宙技术发展趋势分析报告》.docx
- 2025年折叠屏技术迭代中AI功能集成市场反应量化分析报告.docx
- 《2025年教育培训视频化教学与会员学习服务》.docx
- 《2025年工业软件行业CAD国产化应用场景分析报告》.docx
- 《2025年生物制药行业趋势:单抗技术迭代与产业链自主可控规划》.docx
最近下载
- 新教材人音版一年级音乐上册(艺术唱游)全册教案(全30页)(2024年) .pdf VIP
- 丰田卡罗拉启动系统控制电路工作原理分析及故障排除2例.pdf VIP
- 脚手架安全专项监理细则.doc VIP
- 2024—2025学年吉林省长春市东北师大附中明珠学校七年级上学期期末数学试卷.doc VIP
- 系统操作指南.pptx VIP
- 新疆无神论课件.pptx VIP
- SIMATIC S120变频器调试步骤培训(高端培训).pptx VIP
- 智慧树知到《大学生职业生涯规划与就业指导》章节测试答案.pdf VIP
- 国家开放大学《管理英语3》边学边练Unit-1-8(答案全)_可搜索.pdf VIP
- 【机房】供货、安装、调试实施方案.docx VIP
原创力文档


文档评论(0)