面向企业的Web使用挖掘研究.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
维普资讯 咎信息技术 面向企业的Web使用挖掘研究 张彤 童向兰 (1.广西桂林电子科技大学;2.广西大学) 摘要:Web使用挖掘是Web数据挖掘的一种,通过分析用户浏览网站 是基于多维信息的快速统计数据分析技术,目前已有许多成熟的商 的模式,发现对企业决策、管理有用的知识与信息。本文介绍了几种常见的 业化OLAP产品,即使用户对这类技术不熟悉也可直接使用。 Web使用挖掘方式和相应算法,并说明了它们在企业经营中的具体应用。 2_2.2 聚类分析 聚类是数据挖掘工程中一项常见的任务, 关键词:Web使用挖掘 日志 数据挖掘 例如将浏览模式相近的用户归类,发现他们的消费习惯。聚类分析 现代企业在决策、管理、营销等环节变得越来越依赖于快速膨 是一种无监督的模式识别方法,它能在模式的种类与数量未知的情 胀的互联网,很多公司和机构都架设了Web服务器开展电子商务和提 况下把样本按相似性划分成若干有意义的子集。样本的相似性在聚 供在线服务,有的大公司还通过互联网实施全球化管理,协同各个部 类算法中以所谓的“距离”来衡量,例如 ,两个Web页面的相似性也 门的工作。对企业Web服务器上保存的数据进行数据挖掘能够发现隐 称为Web页面距离,计算Web页面距离首先要将Web页面按照 藏在海量数据下的知识与信息,对于提高企业竞争力有重要的价值。 一 定的关键字映射成矢量,然后计算矢量距离。常见的数据挖掘聚 1、Web使用挖掘 类算法有K—means、神经网络聚类、模糊聚类等…。 Web使用挖掘是Web数据挖掘的一种 ,与常规的数据挖掘不 2.2.3 关联规则 关联规则也称购物篮分析, 目的是寻找数 同,它的数据来源不是数据库而是Web服务器上的日志,故而又被 据仓库中数据项之间所存在的关系。Web挖掘中常用的关联规则 称为Web日志挖掘。根据W3C组织的规定,标准Web日志格式 挖掘算法是 1993年提出的Apriori及其改进算法,数据库中出现次 中的各个域为: 数大于一定比例的集合称为大项集或频繁集,Apriori算法循环扫描 IP Address 访 问者 IP 数据仓库中的记录,搜索第一个大项集,然后每次以刚得到大项集 User ID 访 问者 ID 为基础搜索下一个大项集 ,进而发现这些大项集之间的关系 1【】。 Date 本次请求的日期 /时间 2.2.4 序列模式挖掘 序列指时间上有先后的事务,序列模 Request 请求方法 式挖掘不但寻找事务之间的关联,而且分析这些事务在时间上的顺 Status 状态代码 序,挖掘成果可以应用在消费预测、疾病诊断等领域中。常见的序列 Size 本次请求的文件长度 模式挖掘有Apriori类算法、Markov模型、GSP算法等。 有的Web服务器还会加上 3、Web使用挖掘应用 Referer 引用者 3.1 企业客户关系管理 忠诚的客户群是企业最有价值的资 User Agent 浏览器类型 产,现代企业的经营方式正由原来的以企业 自己为中心转变为以客 这两个域。客户在浏览企业网站时,每次向服务器请求阅读一 户为中心。企业互联网网站是企业与客户便捷的联系纽带,如何吸 个Web页面,服务器都会依据这些信息生成一个记录保存在 日志 引客户浏览,将随机浏览客户变为消费顾客 ,偶尔消费型客户变为 文件里。企业Web服务器 日志文件通常积累了大量访问记录,对

文档评论(0)

jingpinwedang + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档