电子商务平台中Web数据挖掘应用探讨.docVIP

电子商务平台中Web数据挖掘应用探讨.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
电子商务平台中Web数据挖掘应用探讨

电子商务平台中Web数据挖掘应用探讨   摘 要:文章对Web数据挖掘技术的简要介绍、Web数据挖掘的过程、电子商务平台中Web数据挖掘技术的应用情况以及Web数据挖掘在电子商务中的作用分析四个方面的内容进行了详细的分析和探讨,从而详细的论述了我国电子商务平台中的Web数据挖掘技术的应用情况。   关键词:电子商务平台;Web数据挖掘技术;应用研究   1 Web数据挖掘技术的简要介绍   1.1 Web数据挖掘的定义。所谓的Web数据挖掘就是指借助于数据挖掘技术在Web服务和Web文档中获取我们所需要的信息,其是一项结构较为复杂的综合性技术,涵盖了计算机语言学、人工智能、数据挖掘技术、数据库、Web技术以及统计学等众多的领域。与传统的数据挖掘技术所不同的是,Web数据挖掘主要的研究对象是以非结构化文档或是半结构化文档为中心的Web,它们的内容和表示是相互交织的,并且没有统一的模式,用语义信息也无法精确的描述出这些数据内容,要想在结构上对这些数据进行描述就必须依靠HEML语法。   1.2 Web数据挖掘的分类。(1)Web结构挖掘。超文本文档相互之间是有着紧密的联系的,所以,WWW在可以显示出文档内容的同时,也可以显示出它们之间的关联关系所代表的内容,对页面进行排序时如果能够很好的应用这些信息,就能够找到有重要应用价值的页面。其根本的作用就是要发现Web结构和页面结构,这样就能够准确的对页面进行聚类和分类,从而找到我们需要的页面;(2)Web内容挖掘。这类Web挖掘技术就是指对Web上富含的大量文档信息进行有效的总结、聚类和分类,对其关联性进行详细的分析,并进行相应的趋势预测,一直到最后获得有价值信息的过程。Web上的数据可以有文本、图形、视频、图像以及声音等多种类型,也可以是结构化的数据或是无结构的自由文本,其主要有Web多媒体挖掘和Web文本挖掘两类;(3)Web使用挖掘。此类挖掘技术是指分析用户访问过的Web的历史记录,掌握用户的浏览习惯和兴趣,预测用户可能发生的浏览行为,从而为其提供个性化的网络服务。   2 Web数据挖掘的过程   2.1 Web资源搜集。此过程就是借助于蜘蛛和爬虫等网页抓取工具来在电子商务网站上搜集用户使用的页面信息,用户请求的页面就是游览页面,其是由脚本、图片和框架等部分组成的。   2.2 预处理。此过程就是在原始数据中集中的除去那些可能对挖掘效果带来负面影响的或是与挖掘过程无关的数据的过程,另外也会适当的删除数据的属性,最后应留下与挖掘过程相关的数据属性。   2.3 特征抽取。此过程就是指对Web文本的内容进行分析、聚类、分类和过滤的过程,其对知识发现以及准确的发现用户的浏览兴趣模式都是有着重要的影响。   2.4 模式发现。采用这种技术所发现的知识模式以及自动的发掘模式,既是对整个文档集合的趋势和结构所进行的藐视,同时也是对上一级文档的含义所进行的描述和概括。   2.5 模式评价。此过程就是对所产生的模式进行质量评价的过程,质量过关时,就应将这一知识模式存储下来,质量不符合要求时,就应进行新一轮的挖掘,直到改进过关为止。   3 电子商务平台中Web数据挖掘技术的应用情况   3.1 路径分析技术。这是一项寻找用户经常访问路径的技术,总体来说,其就是简化路径的过程,对Web服务器中文件和日志中的用户访问站点的次数进行详细的分析,从而找到经常访问的路径,帮助使用用户以最快的速度找到其所需要的产品或是信息。在用户访问某网站时,过多的中间页面势必会降低消费者的浏览兴趣,也提高了网站的维护成本,而这项技术就是有效的分析超链接之间的联系以及网站各个页面之间的联系,掌握访问次数最多的页面,将其它无太大使用价值的删除。   3.2 聚类分析。在市场细分时经常要用到聚类分析技术,将市场有效细分的依据就是顾客特征模式和购买行为的相似性,细分后应针对每一个市场都制定有针对性的营销策略。在电子商务平台上,我们应将有相似特性的用户数据和信息整理到一起,总结和归纳出他们的相似需求和喜好,为用户提供个性化的电子商务平台上的服务,为他们提供有建设性的购买建议,既提高了网络营销的效果,同时也培养了用户的忠诚度。   3.3 分类。此项技术既可以用于破产预测和划分顾客类别的工作中,也可以用于预测哪些购买人群对于赠券和邮寄产品信息等促销手段是感兴趣的。如果是商业性质的网站,分析用户的访问模式和相应的客户信息,就可以总结出用户所访问网站的特征,分类完成后,我们就可以掌握每一类客户的兴趣爱好,也能够发现潜在的购买客户,从而为每一类提供个性化的网络服务,并开展有针对性的商务活动。   3.4 关联分析。这项技术是一类在海量的数据或网络信息中找到项集之间关联性、项集的频繁模式以及因果结构和相互关系的技术,采用这项技术能够清楚

文档评论(0)

3471161553 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档