数据挖掘及关联分析在电子商务中应用研究.docVIP

数据挖掘及关联分析在电子商务中应用研究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘及关联分析在电子商务中应用研究

数据挖掘及关联分析在电子商务中应用研究   [摘要] 本文分析了数据挖掘应用于电子商务领域的重要意义,阐述了电子商务环境中数据挖掘的特点、数据挖掘的流程,重点研究了关联分析在电子商务数据挖掘中的应用。   [关键词] 数据挖掘 电子商务 关联分析      一、数据挖掘应用于电子商务领域的意义   随着互联网的普及和电子商务业务的发展,电子商务网站积累了大量的甚至是G、T规模的客户交易数据。这些庞大数据量和复杂的站点结构,却往往使客户手足无措,无法顺利找到自己需要的商品或信息。虽然Web站点能够提供各种方式的高速查询,但是客户往往很难用查询条件准确地表达出自己的真实需求。即使表达出来了,也经常出现查不出任何有价值的条目的尴尬情况。这是因为商品的各种属性是商家按自己的认识设定的,而客户和商家在商品属性的认识上总是存在着差异。如何充分利用这些数据,将这些大量繁杂的数据转换成有用的信息和知识,从而更好地提高网站的服务质量和创造更多潜在的利润空间,是电子商务迫切需要解决的问题。   数据挖掘技术是解决前述Web站点问题的一把利器。数据挖掘是从大规模的数据中抽取非平凡的、隐含的、事先未知的、有潜在使用价值的信息的技术,是属于发现型的技术。它为解决此类各种应用问题提供了强有力的计算支持。借助数据挖掘技术对电子商务交易数据进行深入的分析,从而为电子商务正确的决策提供强有力的支持;可以从顾客购物的历史数据中发现商品间存在的关联模式、序列模式;从客户的个人信息、购物历史数据中发现客户类别、潜在客户群。同时也有助于客户更好的了解商品,为其提供便利的交易方式和广泛的选择等等。   二、电子商务环境中数据挖掘的特点   1.面向电子商务挖掘的任务更多地表现在客户关系管理方面   电子商务借助Internet让企业和客户之间的交流变得非常便捷、频繁。因此,企业更多的要考虑如何利用这些频繁的交流,敏捷地把握客户的需求动态,从而改进企业与客户交流的方式,更新交流的内容,提供个性化的服务等。   2.面向电子商务的数据挖掘主要是分布式数据挖掘   电子商务系统自身是一个信息化非常完全的系统,其积累的数据一般存储在电子商务系统的数据库中。而这些数据库一般是分布式的,这就决定用户从网络上获取这些数据也必然要采用分布式数据挖掘方式。   3.面向电子商务的数据挖掘通常通过对电子商务系统的改进来提高企业竞争力   比如给客户推出个性化页面把用户最感兴趣的信息放在首页,以便吸引更多客户。通过分析客户的访问规律,确定客户消费的生命周期,针对不同的产品制定相应的营销策略,从而进一步优化网站的组织结构和服务方式,提高电子商务系统的服务效率。   三、电子商务环境中数据挖掘的流程   电子商务中的数据挖掘先是通过 Web 站点采集数据,然后做必要的数据清理工作,接着在“干净数据”上进行数据挖掘,最后把获得的知识投入应用。   1.数据源选取   该任务负责从可用的数据源中抽取分析数据,导入相同的数据集作为所有分析任务的分析源。对电子商务进行数据挖掘时,所需要的数据主要来自于两个方面:一方面来源于客户的登记信息资料,包括客户的背景信息和客户以往的交易数据,另一部分是存于服务器的来自浏览者的点击流,这部分数据主要用于考察客户的行为表现。   2.数据的预处理   数据预处理是通过字段过滤、字段派生、空值处理、数据离散化、数据抽样记录筛选、记录汇总、记录附加、记录合并和记录排序等方法对数据进行清洗,解决数据中的缺值、冗余、数据值的不一致等问题。数据预处理的一个主要任务就是要将用户访问网站留下的原始日志整理成事务数据库,以供数据挖掘阶段使用。因为电子商务数据挖掘的数据比较复杂,所以这是电子商务数据挖掘最关键的阶段。   3.挖掘模型的构建和数据挖掘   将数据转化成一个真正的适合挖掘算法的分析模型是数据挖掘成功的关键。模型的建立与研究的电子商务业务有关。例如研究目标是分析客户群对某种商品的兴趣度的反应,那么所建模型的目标则要反映出能够影响客户群中各个年龄段对该商品的反应的各种相关因素。模型建立后,还需要从模型的准确性、可理解性和性能方面进行综合考察。在进行实际的挖掘操作时要选择合适的算法进行挖掘,以便从海量的数据中得出有效的、新颖的、潜在的、有用的以及最终可以理解的信息和知识。电子商务数据挖掘常用关联规则、序列模式、分类和聚类等技术。   4.结果分析和使用   当数据挖掘出结果后,要对挖掘结果进行解释并且评估。面向电子商务的数据挖掘的结果是否适合,取决于所要解决的问题。所以仅仅考虑某种模式的精确度是没有用的。最重要的是,使用模式模拟实际的行为的适用性。值得注意的是,由于数据挖掘所找到的模式可能只是某一时间内的较短暂的规律,因此即使选用

文档评论(0)

189****7685 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档