数据分析技术2018 案例背景(旧) 淘宝大规模网店综合分析案例.docx

数据分析技术2018 案例背景(旧) 淘宝大规模网店综合分析案例.docx

  1. 1、本文档共46页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
商务数据分析与应用专业教学资源库 商务数据分析 数据分析技术 淘宝大规模网店综合分析案例 一、案例综述 案例编号: 101002 案例名称: 电商行业——淘宝大规模网店综合分析 作者姓名(或单位、或来源): 刘莎莎 案例所属行业: H633纺织、服装及日用品 案例所用软件: Sas EG ?Sas EM 案例包含知识点: CSV导入saseg ????数据导入 表格合并 ????数据整理 数据筛选 变量`计算 频数统计 ? RFM模型 聚类分析?sas编程 关联规则 案例描述: 电子商务是指在各种形式的网络上,包括企业内网、局域网和互联网上以电子行式,进行交易活动和系列服务的行为,是依托于互联网技术的新型电子化商业活动。电子商务内容分为两部分,电子操作和商务贸易活动。利用电子技术,为买卖双方提供无距离限制的便捷贸易服务。电子商务紧密联系生产商和分销商,为客户提供更便捷的高性价比产品,推动了市场资源的全球合理化配置。 在大数据时代,电子商务得到了迅猛发展,电商企业如雨后春笋般出现。与传统的线下销售的企业相比较,电商企业具有的优势和经济价值的资源是爆炸性增长的数据。以天猫为例,根据互联网研究中心的数据显示,截至2014年第一季度,天猫的注册用户已经达到5?亿人次,在线商品的销售数量达到?9亿,天猫的活跃买家已经超过了2.5亿,平均每个购买活跃买家的购买数量达到了?50单以上,页面的浏览量已超过京东的3倍,拥有?22亿的超大规模,每天产品的讯息达到?5亿条。 面对如此海量的信息,数据分析、数据挖掘技术可以帮助电商企业在海量的数据中提取有价值的数据,这些数据有些用来分析消费者购买商品的规律和趋势,还可以帮助电商企业实现未来规划提出可行性报告。 此案例所用数据集来自于一个淘宝网店,属于电商行业,店主想通过数据分析提供一些管理或者销售思路,提高销售业绩。 该数据集记录的是该电商2013年一年的销售记录情况,共有四个csv文件,对应一年中的四个时间段20130502.csv数据集中有26804条观测值20130730.csv数据集中有32676条观测值20131030.csv数据集中有30452条观测值20131230.csv数据集中有30828条观测值。 第1个知识点将4个csv文件导入到sas软件中,并且保存为4个sas数据文件。 第2个知识点是对数据进行初步加工处理。将4个sas数据文件合并为一个大的数据文件,并且将合并后的数据文件保存为originaldata.sas7bdat; 第3个知识点将originaldata.sas7bdat数据集分成两部分,交易成功的数据和交易失败的数据,分别保存为success.sas7bdat和closedata.sas7bdat。 第4个知识点在success.sas7bdat基础上,删掉补邮费或差价的订单,将数据保存为shaixuan1.sas7bdat; 第5个知识点在shaixuan1.sas7bdat基础上,筛选出实际支付金额大于5的订单,将数据保存为shaixuan2.sas7bdat; 第6个知识点在shaixuan2.sas7bdat基础上,删掉退款类订单,将数据保存为shaixuan3.sas7bdat; 第7个知识点在shaixuan3.sas7bdat基础上,删除购买频率大于25的买家的订单,将最终的数据保存为finaldata.sas7bdat; 第8个知识点是在finaldata.sas7bdat数据集的基础之上进行的统计分析,各省交易的订单分布情况。 第9个知识点是对交易失败的订单进行分析。先是在originaldata.sas7bdat, success.sas7bdat, ?closedata.sas7bdat基础之上,分析了交易失败订单在总订单中占得比例。然后在closedata.sas7bdat基础之上,对交易失败的订单的失败原因进行了频数分析。 第10个知识点是在finaldata.sas7bdat数据集的基础之上进行进一步的计算,然后用RFM模型对客户进行画像分析,从而找到最有价值的客户。 ????第11个知识点在finaldata.sas7bdat数据集的基础之上进行进一步的加工,然后用SASEM模块对数据进行关联规则分析,从而可以发现一些推荐规则。 案例执行形式: 单人上机 二、案例知识点: 知识点1: 知识点名称:SAS EG中数据的导入 知识点所属工作角色: 数据导入 知识点背景: 先要将外部数据导入到统计软件中才能进行后续的分析和建模。 知识点描述 将CSV数据导入到saseg中,并且将数据保存为sas格式。 知识点关键词: CSV导入saseg ????数据导入 知识

文档评论(0)

WanDocx + 关注
实名认证
内容提供者

大部分文档都有全套资料,如需打包优惠下载,请留言联系。 所有资料均来源于互联网公开下载资源,如有侵权,请联系管理员及时删除。

1亿VIP精品文档

相关文档