Web使用挖掘技术在电子商务中的应用.docVIP

Web使用挖掘技术在电子商务中的应用.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Web使用挖掘技术在电子商务中的应用.doc

Web使用挖掘技术在电子商务中的应用 【摘要】网络的高速发展下,使得电子商务的传播和应用也更为广泛,客户和商家在挖掘技术的要求上也就有了更多的标准。现今,种类繁多又别具风格的动态结构站点已逐步替代了Web页面的静态结构。本文就电子商务如何在Web挖掘技术上的有效应用,做出相关论述。 【关键词】Web数据挖掘 电子商务 应用 【中图分类号】TP311 【文献标识码】A 【文章编号】1672-5158(2012)11-0065-01 随着电子商务的经济环境不断的发展和改善,企业的销售也开始向全球化进行发展,不再是以往只在本地某一区域内局限性较大的传统销售方式,它的整个销售过程借助网络得以实现。这就使得电子商务的关键在于如何对网站的进行有效利用。企业的发展状况取决于网站对广大用户是否做到了有效的吸引。企业的决策者为使企业能够提升自身的竞争力,扩大发展规模,在信息化网站上不断做出个性化和极具创意的版面和内容,以期能将更多的客户吸引,这当中,企业尤为注重的当属个性化的发展模式。怎样才能面对繁多的数据进行个性化数据的提取,是企业急需解决的问题,这时就产生了数据挖掘技术,本文现就介绍其在电子商务中的具体应用。 一、Web数据挖掘的概念 所谓Web数据挖掘,实在数据挖掘上的一个引申,不只是包括数据库,只要是能够在一起进行组织的任意数据集合,都可以作为数据挖掘的对象,比如万维网的信息资源。在数据挖掘技术中,Web数据挖掘作为其中一项必不可少的部分,主要是在训练样本中进行大范围收集,并有针对性的对信息资源在网络当中进行的提取。 二、Web数据挖掘的主要类型 Web数据挖掘任务具有多样性的特点,这取决于多样化的电子商务的Web信息。根据不同方式的Web处理对象,可以将其类型分为三种:其一是Web内容挖掘,其二是web结构挖掘,其三是Web使用模式挖掘,结构的具体分类(见图1)。 (一)Web内容挖掘 将所需要的数据和内容在网络中进行大量收集的过程成为Web内容挖掘,它能够分析信息间互相的联系,并把在网络数据中的无法显而易见的内容做进一步挖掘。把网络资源做形式上的划分,数据可以包括图像、音视频和文本等,所以,可以归纳为文本、多媒体挖掘这两种形式的Web内容挖掘。现在的挖掘技术虽然都还处在不断的研发与实践之中,但文本挖掘的便利性目前已经有目共睹。 (二)Web结构挖掘 对有实际价值含量的知识在Web页面内容上只能挖掘到一部分,页面结构中同样有着丰富的信息量。对web存在于暗处的结构模式的挖掘,正是web结构挖掘的目的所在,它主要XCWeb页面的超链接关系,以及文档的目录和内部结构进行相关挖掘,因此能归纳为超链接挖掘、内部挖掘以及URL挖掘。 (三)web使用模式挖掘 把Web服务器上用户进行常规访问时的历史记录做出挖掘,从而分析归纳出用户访问的内容和喜好,即为Web使用模式挖掘,它主要是从用户访问网络的行为数据上做出分析,了解用户的意图,能够在电子商务战略上提高大量的援助,挖掘模式上可分为个性化和一般访问模式挖掘两种形式。 三、Web数据挖掘的实现过程 Web数据挖掘的实现可分为四个方面,分别为:数据预处理、模式识别、模式分析和可视化,挖掘过程(见图2)。 (一)数据预处理。 数据预处理可分为数据清洗、用户识别、会话识别和路径补充: (1)数据清洗 将无关于挖掘数据和数据源中多次储存的相同数据进行删减,对访问后的信息有没有完整记录做出判断,并处理用户在访问页面时出现的错误记录,是数据清洗的主要任务。用户访问网络的ID、IP地址、访问万维网页面的具体时间和方式、传输的相关数据等都记录于Web日志之中,但Web数据挖掘需要的信息只是当中的某些成分, (2)用户识别 处理好数据清洗工作后,接下来的工作是用户识别。它主要通过用户的ID、注册时预留的个人资料和使用的系统终端等,来对用户做出是否是新手的判断。之后再根据用户等级的不同,把日志文件做出集中整合,使之互相分离。 (3)会话识别 完成了数据预处理和用户识别后,就要开始会话识别的工作。会话是同一用户进行页面持续的访问,当多个用户进行页面的访问时,便产生了会话的不同,把用户记录做独立性会话记录的划分,是会话识别的主要目的所在。 (4)路径补充 通过Web站点的拓扑结构,来分析页面的方法即为路径补充。当利用站点的拓扑结构,识别出本次用户请求的页面不存在超链接关系与之前请求的页面时,就能判定为不完整的路径。这是不妨将用户本次和上次访问的时间点,取其中点判定为访问补充页面的大体时间。例如,当用户访问页面x时没能够直接跳转到下级页面Y,这时用户通常情况下会使用返回上层的功能重新访问Web页,然后去做z页面的访问。因此,很有必要添加用户对w页面的访问记录,在Y页面和z页面之间。 (二)模式识别 数据进行完预处理工作之后

文档评论(0)

lnainai_sj + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档