Web数据挖掘技术.pdfVIP

  1. 1、本文档共2页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
优秀博硕毕业论文,完美PDF内部资料、支持编辑复制,值得参考!

Science Techno~gyVision IT论坛 科 技 视 界 2011年8月第23期 Web数据挖掘技术 李培培 曹 芳 (北京吉利大学信息学院 中国 北京 102202) 摘【 要】文章主要描述了Web挖掘的原理、分类、数据挖掘的关键技术和数据挖掘的方法。针对Web数据的复杂性和特 殊性,Web的数据挖掘必须对Web页做必要的数据处理,使之达到结构化数据的挖掘要求,或使用XML技术来构造半结构数 据模式再进行数据挖掘 。 【关键词】Web挖掘;内容挖掘;结构挖掘;使用挖掘 0 引言 容挖掘 (WCM)、Web结构挖掘 (WSM)和Web使用挖掘 (WUM)。 随着lntemet/lntranet技术的发展 .尤其是Web的全球普 1.3.1Web内容挖掘 及使得Web上信息量无比丰富,Web已经成为人们获取信息 Web内容挖掘实际上是从Web文档及描述中获取知识 , 的重要途径,但最先进的搜索引擎也只能找到web网页上面 具体来说就是对Web上大量的文档集合的内容进行摘要 、分 很少的网页。而且无论怎么选择关键词都会返回大量并不需 类、聚类 、关联分析、以及利用Web文档进行趋势预测等。 要的结果。如何从非格式化数据信息中有效地挖掘出有用的 Web内容挖掘的对象包括文本、图像、音频、视频、多媒体等 信息是对数据挖掘领域的一个新挑战。 各种类型的数据。其中聚类是事先没有确定类别,但要求把 Web上的数据信息不同于数据库。它主要是些大量的、 相似度高的文档归于相同的类。 异质的Web信息资源,文档结构性差,其数据多为半结构化 1.3.2 Web结构挖掘 或非结构化 ,信息不能清楚地用数据模型来表示。因此在 Web结构挖掘是从wWw 的组织结构和链接关系中推 Web的数据挖掘需要用到很多不同于单个数据仓库挖掘的 导知识的过程。主要是通过对Web站点的结构进行归纳、分 技术。 析和变形,将Web页面进行分类,以利于信息搜索。HTML页 1 Web数据挖掘概述 面所包含的知识不仅存在于各个页面的内容中。也存在于这 些页面之间的相互链接中。利用这方面的知识可以对页面进 1.1Web数据挖掘概念 行排序以发现重要的页面。 Web数据挖掘是一项综合技术,是利用数据挖掘技术从 1.3.3 Web使用挖掘 www数据资源中抽取信息的过程,结合了数据挖掘、信息处 Web使用挖掘就是对用户访问Web时在服务器留下的 理、可视化、数理统计等领域的成熟技术,是对Web数据资源

文档评论(0)

wpxuang12 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档