- 171
- 0
- 约2.04千字
- 约 4页
- 2021-09-18 发布于山东
- 举报
本科学生综合性实验报告
项目组长 张梦瑶 学号 0141262
成 员
专业 国际经贸 班级 国贸 142
实验项目名称 商务数据剖析报告
指导教师及职称 李虹来
开课学期 2015 至 2016 学年 下 学期
上课时间 2016 年 6 月 16 日
1.商业理解阶段
网上销售与传统的店面销售不同,没有售货员提供现场咨询服务。可是,网上销售能够利用互联网的优势,为用户提供更优质的服务。由于服务器会记录用户在浏览电子商务网站时的所有行为,因此,公司很容易收集用户的浏览记录、交易信息及偏好数据。
在个性化介绍技术的关系规则剖析中, 最典型的例子是购物篮剖析, 其目标是发现交易数据库中不同商品之间的联系强度,挖掘用户潜在购置模式,并将这些模式所对应的服务或产品展示给用户,为其提供参照,进而提高用户的满意度及购置率。
数据理解阶段
本案例采用淘宝网的用户交易数据进行剖析,每条交易记录包括记录号和顾客购置的商品,表
1
给出了数据集中各属性名及意义,表
2 为部分交易实例数据示例。
表 1
数据集属性信息
属
性 名
属性意义
交易号 ID
唯一表记每一次用户的交易
商品名
购置的商品名
数量
购置的每同样商品的数量
单价
购置商品的单价
表 2
部分数据实例
ID
数
单
商
品
商 品
商品名
量
价
名
数量
单价
商品名
数量
单价
名
数量
单价
1
女装 T恤
2
79
短裙
2
118
休 闲 男
1
99
连 衣
1
35
装
裙
2
女装 T恤
1
79
短裙
1
118
伞
1
15
3
女装 T恤
1
79
短裙
2
55
高跟鞋
1
63
连 衣
1
35
裙
4
女装 T恤
1
119
短裙
1
55
高跟鞋
1
63
5
女装 T恤
2
119
短裙
1
45
高跟鞋
1
63
6
女装 T恤
1
119
短裙
1
45
高跟鞋
2
63
洗 发
2
85
水
数据准备阶段
原始数据集可能包含了一些冗余的数据、 空值和零值等, 这种格式不能作为关系规则剖析算法的输入,需要对数据进行预办理。 本案例的预办理中包括过滤掉原始数据集中的商品数量和单价这两个属性。同时为了保护顾客的隐私,过滤了用户名属性,并且用交易号来唯一表示顾客的每一次交易。办理后的数据集如表 3 所示。
表 3
部分预办理后的数据
交
易
号
商品 1
商品 2
商品名 3
商品名 4
1
女装 T恤
短裙
休闲男装
连衣裙
2
女装 T恤
短裙
伞
3
女装 T恤
短裙
高跟鞋
连衣裙
4
女装 T恤
短裙
高跟鞋
5
女装 T恤
短裙
高跟鞋
6
女装 T恤
短裙
高跟鞋
洗发水
在 Clementine 软件进行关系规则挖掘时,必须把数据格式变换成 Clementine 软件能办理的格式。往常有两种格式:一种是布尔矩阵形式,即每行表示一条交易记录,列中的 T/F 值表示该商品是否有在相应的交易记录中出现, T 表示有出现, F 表示没有出现(表 4 列出变换后的前 3 条记录信息);一种是事务办理格式, 即每行对应一个交易号和一个商品项 (表 5 列出了前 3 个事务对应的事务办理格式)。
表
4
布尔矩阵格式数据集
交 易
号
女装
T 恤
短 裙
电脑配件
男装牛仔裤
休闲男装
1
2
T
T
T
T
F
F
F
F
T
F
3
T
T
F
F
F
表
交 易
1
1
1
2
2
3
3
5
号
事务办理格式数据集
女装T恤
女装T恤
短裙
休闲男装
女装T恤
短裙
女装T恤
短裙
数据建模
利用 Clementine 中的 Apriori 算法进行关系规则剖析, 设定最小支持度 1%,最小置信度 50%,输
入为布尔矩阵格式的交易数据(如表 4),输出商品的关系规则及相应的支持度、置信度和提升度信
息(如表 6)。表中显示“高跟鞋”和“洗发水” 、“童装”和“玩具” 、“文具”经常被一同购置。
表 6 Apriori 算法运行结果
模型评估
我们选用以下的关系规则向顾客进行介绍。
规则 1:(玩具、文具) =童装
规则 2:洗发水 =高跟鞋
规则 3:玩具 =童装
规则 4:地毯 =家具
规则 5:(短裙、高跟鞋) =女装 T 恤
规则 6:(童装、文具) =玩具
再结合规则和实际经验知识, 能够对规则进前进一步优化办理。 在本案例中, 能够对规则 1{(玩
具、文具) =童装 } 和规则 3{ 玩具 =童装 } 进行归并,以规则 3 的形式呈现。
模型发布
通过建模剖析由得出的关系规则, 公司就能够得到商品销售的一些合理搭配, 进而设定相应的介绍策略。如在顾客购置了地毯后,能够向其介绍家具类商品;或许当顾客购置了童装后,
原创力文档

文档评论(0)