- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
天猫用户对其品牌的行为分析 谢谢观看请老师点评 * * 组长:沈哲培 组员:郑旭琴 徐鸿嘉 黄政橙 陆佳明 李叶宽 翁天奇 目录 数据的来源 数据属性 为什么选? 数据展示 分析及明确目标 论文展示 sas功能运用 初步修改 待定…… 目录 选用工具 挖掘工具及方法 简单数据分析 数据的来源 网址:http://102./competition/addDiscovery/index.htm 阿里巴巴大数据竞赛(天猫用户在4个月对于天猫各品牌的行为日志) 数据属性 用户ID 品牌ID 行为类型 行为时间 为什么选? 阿里巴巴是中国最大和世界第二大网络公司,在2013年的双十一节日中,1小时67亿,6小时不到突破100亿;13小时实现191亿,追平去年成绩;21小时达到300亿,超过阿里官方预期……如此大的交易数据正是我们分析的最好对象。 阿里巴巴如此大的交易,肯定会有不小的回头客,而我们做数据挖掘可以挖掘潜在客户,以及做出一定的预测,在一定的时期或者时间段,进行促销活动,达到更大的收益。 数据展示 用户角度 分析品牌及行为类型(用户id)的关系,对用户进行一个关联分析,比较一件商品购买的条件,购买另一件的可能性。 研究课题 论文展示 参考论文来源:《基于数据挖掘的网络购物行为的分析》中国期刊网/kns/brief/default_result.aspx 寻找类似问题关于算法的论文 通过对用户网络购物行为的分析, 寻找消费者网络购物行为中一些潜在的规律或现象。 相似处 研究对象不同 我们做的研究对象是天猫用户 文献是问卷调查了淘宝和拍拍网的用户。 不同处 论文展示 该文献和我们研究主题的相似处和不同处 数据来源不同 利用问卷调查得到,第一手资料 不同处 论文展示 对数据的处理有借鉴之处 该文献在做不同的研究的时候所用的研究方法是不一样的,或者在同一方法中用到好几个算法。 算法不唯一 数据价值利用 到最大化 在做研究的时候,可以借鉴文献的思路,先具体提出一个明确的研究课题。 不同的数据处理 可以得出不同的实验结论。文献中通过关联分析或者聚类不同的属性分析不同的问题。 在《关联规则分析在网络购物行为影响因素分析中的应用》这一章节主要介绍了Apriori算法。 论文展示 在《聚类分析在网络购物行为结果分析中的应用》这一章节主要应用了K-Means算法和Twostep算法。 在《分类/预测方法在网络购物潜在客户挖掘中的应用》这一章节主要介绍C5.0、CHAID、QUEST、CRT算法。 文献中的主要算法 挖掘工具及方法 挖掘工具:sas,excel 进行了一些简单的筛选,统计,绘图。 运用了抽样,聚类,关联分析,神经 网络等算法 简单数据分析 在所给的数据中,天猫购物消费者的点击次数是非常多的。 说明这些消费者对天猫是比较关注的。 天猫是他们消费的一个场所。 购物的次数明显比收藏和放进购物车的次数多,说明大家在网上看到喜欢的东西,购买的欲望比较强烈,特备是淘宝的一些活动,比如聚划算……。 消费者看到喜欢的,购买的速度会快一点。 简单数据分析 5月开始天气炎热了之后,人们对夏天用的产品需求增加了。比如防晒类 的产品,护肤品,遮阳伞等。消暑类的电器,空调,电扇等。因为天气的渐热,导致需求的增加,行为次数也增加了。 图表显示的一个趋势:从5月到7月,行为次数总的在增加。 数据处理 在sas中user_id与新增加的brand_type进行一个关联分析 sas功能运用 源数据集 关联分析 sas功能运用 经过这个处理之后,数据量总共达8342个。 支持度 置信度 关联数 sas功能运用 对应品牌 1(购买) 2(收藏)3(购物车)操作的一个统计表 sas关联分析的结果 置信度 支持度 关联规则 sas关联分析的结果 75% 4479-1 ==》29099-1 4479 29099 既达到了商家插入广告提高效益的需求,也满足了消费者的购物心理。 初步修改 用户品牌-行为 行为重复次数 源数据经过处理取了有购买及收藏操作的记录 只要分析,购买-》购买,收藏-》购买 初步修改 初步修改 分析两个品牌之间的关系 最小置信度 sas关联分析结果 一系列相关规则 待改进 最终修改及结果 源数据经过处理后分析所有操作记录 主要分析,点击-》购买 最终修改及结果 这是初始设定的一些参数 *
文档评论(0)