一种基于购物网站的Web挖掘工具架构.pdfVIP

一种基于购物网站的Web挖掘工具架构.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一 种基于购物网站的Web挖掘工具架构 垂垂 网站的Web挖掘工具架构 王玉珍 (兰州商学院信息工程学院 甘肃兰州,73O020) 摘 要:web挖掘是数据挖掘的新方向之一,其应用领域非常广泛。架构基于购物网站的Web数据挖掘工具, 通过该工具可发现客户识别、客户获取及客户保持等方面的有用信息,有效地使用这些信息可促进购物网站的发 展 。 关键词:数据挖掘;Web数据挖掘;购物网站 Abstract:Th eWeb nillgisveryimportantdirectionofd~t.mining.Irisappliedinmanyaclivity.TheapplicationofWeb Ili】nl;’s implementinshoppingsite.Wewmfindmanyin-~ tinfonn~on.Toeffe~ yusethisinformationwmpron~ thedevel~ ntof theshoppnigsite. Keywords:DalamimI ;Webm证il ;Sh)p‘lpiIlgsite 中图分类号:TP311.138 文献标识码:B 文章编号:1001—9227(2009)02—0042—04 1 Web数据挖掘 模式分析的任务是验证和解释上一步发现的模式,为挖 1.1 Web数据挖掘的定义 掘结果的应用打好基础。 Web挖掘是一项综合技术,涉及Web、数据挖掘、计 算机语言学、信息学等多个领域。Web挖掘就是从Web文 档、Web活动中抽取感兴趣的、潜在的有用模式和隐藏信 息¨ ’。Web挖掘可以在很多方面发挥作用,如对搜索引 擎的结构进行挖掘、确定权威页面 ¨、Web文档分类 ¨、 图1Web数据挖掘的工作流程 Web log挖掘 、智能查询、建立MetaWeb数据仓库等。我 们从一般的角度出发,对Web挖掘作如下定义。 2 基于购物网站的Web挖掘工具的架构 定义1:Web挖掘是指从大量Web文档结构和使用的集 2.1 基于购物网站的Web挖掘工具的模块设计 合C中发现隐含的模式P。如果将C看作输入,P看作输 基于购物网站的Web挖掘工具是辅助各类购物网站了 出,那么Web挖掘的过程就是从输入到输出的一个映射。 解客户需求的综合分析工具,运行在网站的用户数据库 :C —p 或数据仓库之上。主要包括以下功能模块: Web挖掘从数据挖掘发展而来,因此其定义与我们熟 ●数据提取和净化模块:用来根据挖掘 目标从Web服 知的数据挖掘定义相类似,都是在对大量的数据进行分 务器 日志数据库或数据仓库中抽取相关数据进行二义性 析的基础上,作出归纳性的推理,预测客户的行为,帮 分析 ,消除不一致性,为下一步挖掘提供优质 的数据 助企业的决策者调整市场策略,减少风险,作出正确的 源 ; 决策的过程。但是对Web进行有效的资源和知识挖掘面临 ● 数据挖掘模块:是一个挖掘驱动部件。它根据挖 极大的挑战,如Web的信息量过大,Web页面的复杂性高 掘要求到web数据挖掘算法库中去选择合适的挖掘方法, 于任何传统的文本文件等。 并且使用该方法去执行挖掘任务; 1.2 Web挖掘的流程 ●web数据挖掘算法库:是一个数据挖掘分析方法的 典型的挖掘流程如图l所示。 综合性算法库。它以插件的方法来组织各种挖掘算法, 资源发现的主要任务是从 目标Web文档中获得数据 各种方法可以方便的插入 ,实现了可扩充性和易选择 (源数

文档评论(0)

在水一方 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档