数据挖掘技术-Data Mining在电子商务中的应用.pptVIP

数据挖掘技术-Data Mining在电子商务中的应用.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘技术-Data Mining在电子商务中的应用

数据挖掘技术-Data Mining 在电子商务中的应用 1 从Amazon说开去 1995年7月,杰夫.贝索斯 西雅图 以30万美元的第一笔投资创业成立Amazon 1997年Amazon成为了全球最大的网上书店。 销售额 1997年1.47亿美元、1998年6.1亿美元、1999年8亿、2001年12.4亿美元、2002年达到17.4亿美元。2002年利润11.2亿美元,2004年,在线零售市场销售收入为69.2亿美元。2005年,亚马逊净销售额为84.9亿美元。 Amazon全球顾客4000万,遍及160多个国家,销售品种超过430万。 杰夫.贝索斯以其卓越的业绩被称为“电子商务之父”。 关联规则是购物篮分析的基础应用。 而关联规则是数据挖掘的研究方向。 近十几年来,人们利用信息技术生产和搜集数据的能力大幅度提高,千万万个数据库被用于商业管理、政府办公、科学研究和工程开发等等,在这被称之为信息爆炸的时代,信息过量几乎成为人人需要面对的问题。如何才能不被信息的汪洋大海所淹没,从中及时发现有用的知识,提高信息利用率呢?要想使数据真正成为一个公司的资源,只有充分利用它为公司自身的业务决策和战略发展服务才行,否则大量的数据可能成为包袱,甚至成为垃圾。    数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。 2 Amazon的购买过程分析 2.3 什么是关联挖掘? 关联规则挖掘: 在交易数据、关系数据或其他信息载体中,查找存在于项目集合或对象集合之间的频繁模式、关联、相关性、或因果结构。 应用: 购物篮分析、交叉销售、产品目录设计、 loss-leader analysis、聚集、分类等。 举例: 规则形式: “Body ? Head [support, confidence]”. buys(x, “diapers”) ? buys(x, “beers”) [0.5%, 60%] major(x, “CS”) ^ takes(x, “DB”) ? grade(x, “A”) [1%, 75%] 规则度量:支持度与可信度 查找所有的规则 X Y ? Z 具有最小支持度和可信度 支持度, s, 一次交易中包含{X 、 Y 、 Z}的可能性 可信度, c, 包含{X 、 Y}的交易中也包含Z的条件概率 关联规则挖掘:路线图 布尔 vs. 定量 关联 (基于 处理数据的类型) buys(x, “SQLServer”) ^ buys(x, “DMBook”) ? buys(x, “DBMiner”) [0.2%, 60%] age(x, “30..39”) ^ income(x, “42..48K”) ? buys(x, “PC”) [1%, 75%] 单维 vs. 多维 关联 (例子同上) 单层 vs. 多层 分析 那个品种牌子的啤酒与那个牌子的尿布有关系? 各种扩展 相关性、因果分析 关联并不一定意味着相关或因果 最大模式和闭合相集 添加约束 如, 哪些“小东西”的销售促发了“大家伙”的买卖? 3 亚马逊如何在用户身上赚钱 3.1 哪些客户将是合作伙伴的销售目标? 是一个网上药房和信息站点,提供非常健康方式采购健康、美容、保养、个人保健和药品。 问题: 1、在Amazon的客户,哪些人会成为drugstore的用户? 2、这些客户中,哪些容易购买保健产品?哪些容易购买 感冒产品?----邮件营销,产品推荐。 3、顾客的购买消费习惯如何?-----购买时间?购买周期?购买数量?付款方式?物流选择?-----提供更优质的服务。 决策树的基本结构 树的生长过程 豆瓣网是一个关于书、电影、音乐及其评论国内最权威最方便的网站,不同于供浏览的门户网站,豆瓣是一个鼓励你参与的社会性工具。你参与的越多,收获也就越多。 一年前,在几个朋友近二十万的集资赞助下,杨勃创办了一个名叫豆瓣的网站,口号是“萝卜青菜,各有所爱”,内容是书、电影、音乐,全是杨勃自己喜欢的东西。 现在,这个页面简单的豆瓣网()在网络上越来越火,会员已经发展到近20万人,日点击量在80万以上。 你的个人推荐是根据你的收藏和评价自动得出的,每个人的推荐清单都不相同。你的收藏和评价越多,豆瓣给你的推荐会越准确和丰富。 每天推荐的内容可能会有变化。随着豆瓣的长大,给你推荐的内容也会越来越准。 推荐算法-----数据挖掘领域。

文档评论(0)

ligennv1314 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档