网站大量收购独家精品文档,联系QQ:2885784924

基于关联规则的电子商务用户分析及研究.docVIP

基于关联规则的电子商务用户分析及研究.doc

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于关联规则的电子商务用户分析及研究   摘要:数据挖掘技术可以把电子商务的海量的数据和信息进行一个挖掘,使这些数据和信息得到最有效的利用,既转化为知识的过程。帮助电子商务企业分析电子商务客户的行为,提供更加优质的,具有针对性的服务,最终实现盈利。该文通过Weka完成了对数据的预处理,然后用了关联规则中的Apriori算法对电子商务网络购物用户进行了行为分析,最后对电子商务运用数据挖掘技术促进自身发展和实际应用提出建议和意见。   关键词:Weka;数据挖掘技术;B2C;电子商务   中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2016)13-0259-02   1概述   随着各种有关数据挖掘的新技术和相关研究的出现,使电子商务企业分析客户行为,对客户进行分类,从而采取相应对策发展新客户,留住老客户,提高用户好感度和满意度,提高自身电子商务网站的吸引力和影响力成为可能。电子商务的竞争无比的激烈,也有着很多的商机,谁能从这些数据中挖掘出可以利用的知识,谁就更能在行业竞争中成为获胜的那一方。   本文研究的目的是通过运用数据挖掘技术对电子商务数据和信息(比如客户的个人信息、电子商务网站用户行为信息调查数据等)做一个分析,来挖掘出能够对电子商务企业的决策和未来的发展提供帮助的知识模型。通过数据挖掘技术所挖掘出的模式知识,帮助电子商务企业分析客户的行为,为企业发展新客户,留住老客户,提高企业竞争力。   2用户数据准备   2.1原始数据收集   本文数据来源于淘宝网上商城购物平台后台数据库中从2013年11月至2014年年底历史交易信息,包括网购相关信息以及网购用户信息等。其数据来源于数据堂()这个大型的专题数据网站,数据是后缀为.xls的格式文件,需要对其进行格式转换为后缀是.csv的格式文件才能导入到Weka中进行分析。   经过数据筛选梳理,最终研究的样本包括999条网购列表。其中,审核未通过的有248条;209条是网购放弃;542条成功网购,169条已还完网购。成功交易总额达3090.93万元。   就整体研究数据来看,未通过的网购所占比例达到24.8%,未购买成功所占比例达到20.9%,网购成功仅有54.3%,从中可以看出网购成功率亟需提高。   2.2用户特征分析   通过对数据源中网购用户信息的整合,得到了B2C购物网站用户活动数据,包括用户的网购次数、成功网购次数、信用等级、网购总额等信息,这里的变量数值均是从2013年7月至2014年底的统计数据。为了了解B2C购物网站平台用户的不同行为模式与特征,这里本文选取网购用户ID号、平均网购额度、网购总次数、网购成功次数、信用等级、网购积分(网购用户作为网购用户进行购物所获得的网购积分)作为聚类变量。   平均网购金额是指网购用户在样本2013年11月至2014年底内的网购金额的平均水平。大体上说, 网购用户信用等级越高,其网购的金额就越大。   网购总次数,通过统计网购用户在样本2013年11月至2014年底内的网购次数,可以看出该网购用户在B2C购物网站平台上的活跃程度,网购次数越多,活跃程度越高。   网购成功次数,成功次数越多表明网站越受网购用户关注与信任。   信用等级,作为网购用户重要的信用属性,也是电子商务企业判断网购用户购物风险的重要依据。本文研究的目的就是找出网购用户信用等级所不能反映出来的网购用户信用属性,所以信用等级作为对比,在此引用。   网购积分,B2C网络购物平台用户往往有网购用户与卖家用户两个角色,一方面网购交易,另一方面可以进行买卖。B2C购物网站平台用户只要成功网购一定金额就会获得相应的网购积分,所以,网购积分也是判断网购用户信用的重要因素。   2.3数据预处理   数据的预处理是整个数据挖掘过程中工作量最大的一部分,虽然处理起来相当的消耗时间,但是绝对不可以马虎对待。这是因为没有经过数据预处理的原始数据是很难被有效地利用起来的,也很难从中挖掘出有用的模型,所以进行数据预处理是数据挖掘的很重要的一个过程。本文所使用的数据挖掘工具Weka就自带了数据预处理的功能,下面是对所得数据进行预处理的过程。   2.3.1特征选取   本次分析一共选取了17个特征600个样本,分别是:ID号、平均购物额度、购物总次数、交易成功次数、信用等级、购物积分。   (1)ID号:购物网站上网购客户的ID ;   (2)平均购物额度:网购客户平均的网购服务的金额;   (3)购物总次数:网购客户的每个月购物次数;   (4)交易成功次数:网购客户的交易成功次数;   (5)信用等级:网购客户的购物信用等级;   (6)购物积分:网购客户购物的积分;   (7)Pincom

文档评论(0)

小马过河 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档