- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Web挖掘综述.pdf
维普资讯
网络技术
计 算 机 与 网 络 创 新 生 活
Web挖掘综述
呼声波
(山东师范大学 管理与经济学院管理科学与工程专业 山东 济南 250014)
摘【 要】文章概述了web挖掘 以及它的几个分类,阐述了Web挖掘的应用前景以及在web2.0到来之时,web挖掘所
面临的机遇与挑战。
关【键词】web挖掘 内容挖掘 结构挖掘 使用挖掘 用户性质挖掘 web2.0
行总结、分类、聚类、关联分析,以及利用web文档进行趋势
1引言 预测等。Web多媒体挖掘就是基于web多媒体的内容特征以
及这些特征相关的语义,从大型Web多媒体数据集中发现和
分析出隐含的、有效的、有价值的、可理解的模式。
自2O世纪 9O年代初因特 网开始迅速发展至今 ,虽然只
(2)Web结构挖掘是从 www 的组织结构及 引用和被
有短短的 1O多年的时间,但它已发展成为经济、社会、文化、
引用的链接关系中推理知识的过程 。Web页包含的不仅仅
教育乃至娱乐等许多方面的重要组成部分,是我们工作和生
是页面的文本 内容 ,同时还有一页到另一页的超链接,超
活中不可或缺的组成部分。
链接结构包含了大量的注释 ,通过挖掘这些结构信息,可
因特网上包含了大量 的web站点,每一个 web站点就
以更加精确地理解web内容 的相关性及质量。另外,web
是一个数据源 (如用户浏览记录、交易记录、日志文件 、网络页
结构还包括一个网页内部的可 以用 HTML、XML表示的
面信息等),此外,web还包含了丰富和动态的超链接等信息,
树形结构,以及文档URL中的 目录路径结构等。通过挖掘
如何从这些信息中发现信息或知识已成为数据挖掘的又一个
web的结构信息,可以揭示许多蕴涵在web内容之外的
应用领域。
隐含 的有用信息。
0)Web使用挖掘就是对用户访 问www 时在服务器留
2Web挖掘定义及分类
下的访 问记录进行挖掘 。当用户访 问web页面时,用户的 IP
地址、I)【、访 问时间、页面URL等信息在 Log日志中均有相
Web挖掘是从数据挖掘的角度发展而来。数据挖掘指的
应的记录。因而对其进行挖掘 ,可以获得许多有意义的信息。
是从大型数据库或数据仓库中提取隐含的、潜在有用的、易被
Web的Log数据包括:ServerLog,ProxyServerLog以及客户
理解的知识的过程。将数据挖掘与Www 相结合,即得到了
端的CookiesLog等。
您可能关注的文档
最近下载
- 免费小学生竞选班长卡通PPT模板 (31).pptx VIP
- 电动汽车控制系统及检修课件-第一部分.pptx VIP
- 高中研究性学习调查报告PPTppt.pptx VIP
- 2025年高考英语阅读理解238个抢分关键词+572个高频词.doc VIP
- 4)-A統計基礎及品質統計.ppt VIP
- 2025最新贵州省专业技术人员继续教育公需科目考试题库及答案(全)).docx VIP
- 赵海洋 十年 完整钢琴谱.pdf VIP
- 2025年高考语文备考之文言文《古文观止》训练50篇.pdf VIP
- 青岛版数学一年级上册《20以内的进位加法》单元整体备课设计.docx VIP
- 2025至2030中国跑腿服务行业市场分析及竞争形势与发展前景预测报告.docx
文档评论(0)