商务数据分析报告.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
商务数据分析报告

本科学生综合性实验报告 项目组长 张梦瑶 学号 0141262 成 员 专业 国际经贸 班级 国贸142 实验项目名称 商务数据分析报告 指导教师及职称 李虹来 开课学期 2015 至 2016 学年 下 学期 上课时间 2016 年 6 月 16 日 1.商业理解阶段 网上销售与传统的店面销售不同,没有售货员提供现场咨询服务。但是,网上销售可以利用互联网的优势,为用户提供更优质的服务。由于服务器会记录用户在浏览电子商务网站时的所有行为,因此,企业很容易收集用户的浏览记录、交易信息及偏好数据。 在个性化推荐技术的关联规则分析中,最典型的例子是购物篮分析,其目标是发现交易数据库中不同商品之间的联系强度,挖掘用户潜在购买模式,并将这些模式所对应的服务或产品展示给用户,为其提供参考,从而提高用户的满意度及购买率。 2. 数据理解阶段 本案例采用淘宝网的用户交易数据进行分析,每条交易记录包括记录号和顾客购买的商品,表1给出了数据集中各属性名及意义,表2为部分交易实例数据示例。 表1 数据集属性信息 属 性 名 属 性 意 义 交易号ID 唯一标识每一次用户的交易 商品名 购买的商品名 数量 购买的每一样商品的数量 单价 购买商品的单价 表2 部分数据实例 ID 商品名 数量 单价 商品名 数量 单价 商品名 数量 单价 商品名 数量 单价 1 女装T恤 2 79 短裙 2 118 休闲男装 1 99 连衣裙 1 35 2 女装T恤 1 79 短裙 1 118 伞 1 15 3 女装T恤 1 79 短裙 2 55 高跟鞋 1 63 连衣裙 1 35 4 女装T恤 1 119 短裙 1 55 高跟鞋 1 63 5 女装T恤 2 119 短裙 1 45 高跟鞋 1 63 6 女装T恤 1 119 短裙 1 45 高跟鞋 2 63 洗发水 2 85 3. 数据准备阶段 原始数据集可能包含了一些冗余的数据、空值和零值等,这种格式不能作为关联规则分析算法的输入,需要对数据进行预处理。本案例的预处理中包括过滤掉原始数据集中的商品数量和单价这两个属性。同时为了保护顾客的隐私,过滤了用户名属性,并且用交易号来唯一表示顾客的每一次交易。处理后的数据集如表3所示。 表3 部分预处理后的数据 交 易 号 商品1 商品2 商品名3 商品名4 1 女装T恤 短裙 休闲男装 连衣裙 2 女装T恤 短裙 伞 3 女装T恤 短裙 高跟鞋 连衣裙 4 女装T恤 短裙 高跟鞋 5 女装T恤 短裙 高跟鞋 6 女装T恤 短裙 高跟鞋 洗发水 在Clementine软件进行关联规则挖掘时,必须把数据格式转换成Clementine软件能处理的格式。通常有两种格式:一种是布尔矩阵形式,即每行表示一条交易记录,列中的T/F值表示该商品是否有在相应的交易记录中出现,T表示有出现,F表示没有出现(表4列出转换后的前3条记录信息);一种是事务处理格式,即每行对应一个交易号和一个商品项(表5列出了前3个事务对应的事务处理格式)。 表4 布尔矩阵格式数据集 交 易 号 女装T恤 短 裙 电 脑 配 件 男装牛仔裤 休 闲 男 装 1 T T F F T 2 T T F F F 3 T T F F F 表5 事务处理格式数据集 交 易 号 女装T恤 1 女装T恤 1 短裙 1 休闲男装 2 女装T恤 2 短裙 3 女装T恤 3 短裙 4. 数据建模 利用Clementine中的Apriori算法进行关联规则分析,设定最小支持度1%,最小置信度50%,输入为布尔矩阵格式的交易数据(如表4),输出商品的关联规则及相应的支持度、置信度和提升度信息(如表6)。表中显示“高跟鞋”和“洗发水”、“童装”和“玩具”、“文具”经常被一起购买。 表6 Apriori算法运行结果 5. 模型评估 我们选取以下的关联规则向顾客进行推荐。 规则1:(玩具、文具) 童装 规则2:洗发水 高跟鞋 规则3:玩具 童装 规则4:地毯 家具 规则5:(短裙、高跟鞋) 女装T恤 规则6:(童装、文具) 玩具 再结合规则和实际经验知识,可以对规则进行进一步优化处理。在本案例中,可以对规则1 (玩具、文具) 童装 和规则3 玩具 童装 进行合并,以规则3的形式呈现。 6. 模型发布 通过建模分析由得出的关联规则,企业就可以得到商品销售的一些合理搭配,进而设定相应的推荐策略。如在顾客购买了

文档评论(0)

didala + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档