- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
决策树技术在淘宝运营平台的应用与分析
PAGE
PAGE 6
第 PAGE \* Arabic \* MERGEFORMAT 6 页第 PAGE \* Arabic \* MERGEFORMAT 6 页
华南理工大学
本科毕业设计(论文)开题报告
论文题目 决策树技术在淘宝运营平台的应用与分析
班 级__11软件工程卓越班 _
姓 名______王腾云_________
学 号____201136634125_____
指导教师_______宋恒杰________
开题时间______2015.3.1 _______
填表日期______2015.3.13 ______
开题报告内容:
选题背景和意义
截至 2014 年 12 月,我国使用网上支付的用户规模达到 3.04 亿,较 2013 年底增加 4411万人,增长率为 17.0% 。与 2013 年 12 月底相比,我国网民使用网上支付的比例从 42.1%提升至 46.9% 。与此同时,手机支付用户规模达到 2.17 亿,增长率为 73.2%,网民手机支付的使用比例由 25.1%提升至 39.0%[1]。截止2014年6月中国网络零售市场交易规模达10856亿元,2013年上半年达7542亿元,同比增长43.9%,预计2014年有望达到27861亿元。中国网络零售市场交易规模占到社会消费品零售总额的8.7%,2013年上半年达到6.8%,同比增长27.9%[2]。越来越多网民开始在网络零售市场消费。2014 年随着京东、聚美优品、阿里巴巴的上市,网络零售市场格局趋向稳定。淘宝网、天猫、京东的品牌渗透率位居前三位,分别为 87%、69.7%和 45.3%[3],遥遥领先于同类竞争对手。由此可见在未来几年内,中国电子商务特别是淘宝和天猫发展潜力巨大,网络零售市场越来越成为中国网民喜爱的购物平台,在电子商务环境下消费者行为的研究显得及其重要。
在中国C2C市场,淘宝拥有超过60%的市场份额。淘宝网自2007年7月正式启动网络广告业务,将网站重要的banner广告位和搜索结果右侧的广告位对外销售,网络广告服务是淘宝官方正式宣布的首个盈利模式,主要指开拓网络营销渠道,另外淘宝网络营销推广平台(阿里妈妈)还向广告客户推出了增值服务计划,包括了品牌推广,市场研究,消费者研究和社区活动等。阿里妈妈网络营销推广平台拥有淘宝、天猫、1688等阿里巴巴集团站内的优质流量展现位置,同时合作60万家外部网站,日均50亿PV覆盖。2010年总收入大概是50亿,其中广告占总收入的80%,约为40亿元人民币,是淘宝网的主要盈利模式。与传统的传媒行业不一样,淘宝网络广告业务中,消费者直接参与了生产和流通循环,消费者在淘宝网上的每一个行为都被记录了下来。在阿里云大数据平台上可以获取这些消费者行为数据的使用权限。为我们应用决策树技术为消费者使用个性化推荐算法打下了基础。
项目研究现状
Resnick Varian 在1997年正式定义了电子商务推荐系统[4],指出利用电子商务网站向客户提供商品的信息和建议,帮助用户选择购买哪些产品,模拟了销售人员帮助顾客完成购买过程。电子商务的销售行业使用了个性化推荐算法之后,销售额能提高2%-8%[5],其主要优势表现在三个方面:①将电子商务网站的浏览者变为购买者,②提高电子商务网站的交叉销售能力,③提高客户对电子商务网站的忠诚度[6]。这三个方面也是此次毕业设计所关注的重点。
目前国内外广泛应用的个性化推荐策略有两种[7],一种是以网页为推荐对象的搜索系统,主要采用web数据挖掘的方法与技术,为用户推荐符合其兴趣爱好的网页,如百度等;另一种是在电子商务平台下,以商品为基本单位的个性化推荐系统,目的就是为用户推荐喜爱的商品,或者为商品寻找潜在的用户。文献[8]给出了区别推荐技术的两维属性:自动化程度(degree of automation),客户要得到推荐是否需要显式的输入信息(比如搜索关键字);持久性程度(degree of persistence),推荐系统产生推荐是基于客户当前的单个会话(session) 还是基于客户的多个会话。另外推荐系统的个性化程度(degree of personalization)也是评判系统好坏的标准。
联系实际工业环境与众多数据挖掘算法,决定使用决策树为基本数据结构。决策树是一种高效的分类器,具有很多优势[9]:
(1)在模型建立过程中使用者可以使用相关领域的背景知识,只要训练事例能够用属性—结论的方式表达出来,就能用该算法进行学习,在我们选取用户特征的时候提供了很大的便利;
(2)决策树的训练时间相对较少,模型相对简洁,其他的分类方法如神经网络,即使对小数据集也要花费很多的训练时
文档评论(0)