- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《中国商贸》
CHINA BUSINESSTRADE
E-business 电子商务
电子商务中Web数据挖掘的应用研究
河北软件职业技术学院 丁宏伟 赵永葆
摘 要:当今互联网拥有海量的数据,如何对这些Web上的数据进行挖掘提取有用的模式,辅助企业获得成功,是一个刻不容缓的问题。
本文对Web数据挖掘的基本内容和相应的技术作了介绍,并对Web数据挖掘在电子商务中可应用的范围作了说明。
关键词:Web数据挖掘 电子商务
中图分类号:F011 文献标识码:A 文章编号:1005-5800(2009)09(b)-068-02
在电子商务领域,通过Web数据挖掘,不仅可以从大量多种多 (3)序列模式:序列模式挖掘就是挖掘出交易集之间有时间序
样信息的Web页面中提取出我们需要的有用的知识,还可以得到关 列关系的模式,在Web 日志中发现所有满足用户规定的最小支持
于群体用户访问行为和方式的普遍知识,用以改进Web服务设计。 度的大序列模式。序列模式的发现就是在时间戳有序的事务集中,
更重要的是,通过对用户特征的理解和分析,如对用户访问行为、 找到那些“一些项跟随另一个项”的内部事务模式。例如:在/class/
频度、内容等的分折,提取出用户的特征,从而为用户定制个性化的 book1上进行过在线定购的顾客,有60%的人在过去15天内也在/
界面,有助于开展有针对性的电子商务活动。 class/bag1处下过订单。发现序列模式能够便于进行电子商务的组
织预测客户的访问模式,对客户开展有针对性的广告服务。通过系
1 Web数据挖掘简介 列模式的发现,能够在服务器方选取有针对性的页面,以满足访问
当今Web上存在着大量的数据,获取有用信息成为人们关注的 者的特定要求。
焦点。但Web是无结构的、动态的,Web页面极其复杂。这样就使得 (4)分类规则:分类技术主要是根据用户群的特征挖掘用户群
人们从成千上万的Web站点中找到有用的数据变得比较困难。于 的访问特征。在Web数据挖掘中,分类规则的发现就是给出识别一
是,人们就越来越关注如何开发和利用Web上的数据资源。 个特殊群体的公共属性的描述,这个描述可以用来分类新的项,例
Web数据挖掘就是解决上述问题的一个途径。当数据挖掘技 如:在/class/book2 进行过在线定购的顾客中有 55%是20~30岁生
术应用于网络环境下的Web 中就成为Web数据挖掘。Web数据挖掘 活在南方的年轻人。得到这一分类后,就可以进行适合这一类客户
就是从Web文档和Web活动中抽取感兴趣的潜在的有用模式和隐 的商务活动。
藏的信息。 (5)聚类:聚类技术是对符合某一访问规律特征的用户进行用
Web挖掘可以分为三类:Web 内容挖掘、Web结构挖掘和Web 户特征挖掘。聚类分析可以从Web访问信息数据中聚集出具有相
使用挖掘 [3] 。Web 内容挖掘是用来提取文字、图片或其他组成网页 似特性的那些客户。在Web事务日志中,聚类顾客信息或数据项能
内容成分的信息;Web结构挖掘是用来提取网络的拓扑信息,即网 够便于开发和执行未来的市场战略。这种市场战略包括:自动给一
页之间的衔接的信息;Web使用挖掘是用来提取关于客户如何运用 个特定的顾客聚类发送销售邮件,为一个顾客聚类动态地改变一
浏览器浏览和使用这些衔接的信息。
文档评论(0)