Web挖掘综述.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Web挖掘综述.pdf

维普资讯 网络技术 计 算 机 与 网 络 创 新 生 活 Web挖掘综述 呼声波 (山东师范大学 管理与经济学院管理科学与工程专业 山东 济南 250014) 摘【 要】文章概述了web挖掘 以及它的几个分类,阐述了Web挖掘的应用前景以及在web2.0到来之时,web挖掘所 面临的机遇与挑战。 关【键词】web挖掘 内容挖掘 结构挖掘 使用挖掘 用户性质挖掘 web2.0 行总结、分类、聚类、关联分析,以及利用web文档进行趋势 1引言 预测等。Web多媒体挖掘就是基于web多媒体的内容特征以 及这些特征相关的语义,从大型Web多媒体数据集中发现和 分析出隐含的、有效的、有价值的、可理解的模式。 自2O世纪 9O年代初因特 网开始迅速发展至今 ,虽然只 (2)Web结构挖掘是从 www 的组织结构及 引用和被 有短短的 1O多年的时间,但它已发展成为经济、社会、文化、 引用的链接关系中推理知识的过程 。Web页包含的不仅仅 教育乃至娱乐等许多方面的重要组成部分,是我们工作和生 是页面的文本 内容 ,同时还有一页到另一页的超链接,超 活中不可或缺的组成部分。 链接结构包含了大量的注释 ,通过挖掘这些结构信息,可 因特网上包含了大量 的web站点,每一个 web站点就 以更加精确地理解web内容 的相关性及质量。另外,web 是一个数据源 (如用户浏览记录、交易记录、日志文件 、网络页 结构还包括一个网页内部的可 以用 HTML、XML表示的 面信息等),此外,web还包含了丰富和动态的超链接等信息, 树形结构,以及文档URL中的 目录路径结构等。通过挖掘 如何从这些信息中发现信息或知识已成为数据挖掘的又一个 web的结构信息,可以揭示许多蕴涵在web内容之外的 应用领域。 隐含 的有用信息。 0)Web使用挖掘就是对用户访 问www 时在服务器留 2Web挖掘定义及分类 下的访 问记录进行挖掘 。当用户访 问web页面时,用户的 IP 地址、I)【、访 问时间、页面URL等信息在 Log日志中均有相 Web挖掘是从数据挖掘的角度发展而来。数据挖掘指的 应的记录。因而对其进行挖掘 ,可以获得许多有意义的信息。 是从大型数据库或数据仓库中提取隐含的、潜在有用的、易被 Web的Log数据包括:ServerLog,ProxyServerLog以及客户 理解的知识的过程。将数据挖掘与Www 相结合,即得到了 端的CookiesLog等。

文档评论(0)

weiwoduzun + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档