基于Web的数据挖掘技术与相关研究.docVIP

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于Web的数据挖掘技术与相关研究.doc

基于Web的数据挖掘技术与相关研究   摘 要:在互联网应用日益广泛的今天,Web所涉及的服务越来越广泛,这使得Web上的信息量不断增多,大大增加了Web数据库系统的数据量。此种情况下,依旧采用传统方式方法来获取用户所需信息,需要消耗较多的时间,且难以保证信息的准确性,但基于Web的数据挖掘技术的应用,则可以快速的进行数据挖掘、数据处理、数据检验、数据转化,进而为用户提供所需信息。因此,基于Web的数据挖掘技术具有较高的应用价值,其目前在电子商务、网络教育、网站设计等多方面有很好的应用。基于此,该文将从分析数据挖掘技术及基于Web的数据挖掘技术展开,就基于Web的数据挖掘技术及应用予以研究。   关键词:Web 数据挖掘技术 相关研究   中图分类号:TP391 文献标识码:A 文章编号:1674-098X(2016)08(b)-0100-02   在互联网技术应用越来越广泛的情况下,互联网已经成为人们日常生活的一部分。基于此,互联网内容不断增多,信息过载现象日益明显。此种情况下,为了使人们的生活能够更加顺畅,及时且快速的获取到所需信息,需要科学、合理的运用基于Web的数据挖掘技术,充分发挥起作用,对数据进行深度的挖掘,进而有效地处理和检验数据,在此基础上将数据转化为完整的信息,供用户所用[1]。由此看来,在互联网内容不断增多,Web数据库系统的数据量不断增多的情况下,基于Web的数据挖掘技术的科学、合理应用是非常重要的,可以帮助用户快速获取所需信息。   1 数据挖掘技术及基于Web的数据挖掘技术   1.1 数据挖掘技术   数据挖掘技术是为了方便人们在大量的数据中快速、正确的找到自己想要的信息而应运而生的技术。在现代化的今天,数据挖掘技术的应用日益广泛,尤其是在计算机技术和数据特征的支持下所构建的数据挖掘系统,可以确定数据挖掘目标,在此基础上以数据库为挖掘对象,从中挖掘所需数据,再对数据进行预处理和再加工,进而检查数据的完整性,确定数据完整的情况下会将其转化成可以被理解的信息,供用户应用。所以,在现代化的今天,人们对信息需求越来越大的情况下,数据挖掘技术的研究与应用是非常有意义的[2]。   1.2 基于Web的数据挖掘技术   1.2.1 基于Web的数据挖掘技术的概述   基于Web的数据挖掘技术,简单来说就是将数据挖掘技术应用到Web上。在现代化的今天,Web所涉及的服务越来越广泛,这使得Web上的信息量不断增多,此种情况下,有效的利用数据挖掘技术,可以对用户所需信息的相关数据挖掘、处理,进而转化为信息供用户应用。   1.2.2 基于Web的数据挖掘的特点   在Web所涉及业务越来越广泛的情况下,Web上的数据量不断增多,直接存在庞大的数据库系统之中。此种情况下,用户需要使用所需信息,就需要在Web的数据库系统中进行数据挖掘,但因数据库系统中的数据量较多,利用传统的方式方法难以快速且准确的找到所需信息。但基于Web的数据挖掘技术的应用则不同,其结构模式不严格,可以灵活的运用,在数据库系统中进行数据挖掘与处理,进而转化为用户所需信息。另外,基于Web的数据挖掘技术适应Web环境且在Web上应用,因此在设置Web数据挖掘时是结合了Web的实际情况,因此基于Web的数据挖掘与Web的特点相贴合,所以,基于Web的数据挖掘具有动态性、异构性、灵活性、有效性等特点[3]。   1.2.3 基于Web的数据挖掘的分类   从目前基于Web的数据挖掘应用实际情况来看,基于Web的数据挖掘主要分为Web结构挖掘、Web内容挖掘及Web访问挖掘3类。   (1)Web结构挖掘。   Web结构包括不同网页之间的超链接结构和一个页面内部的树形结构,以及文档URL中的目录路径结构等。Web结构挖掘的使用,将会把Web表示成一个有向图,图中的点对应的是Web的页面、图的边对应的是Web的超级链接,此种情况下,可以获得一个站点的主页到任意一个定点的最短路径,进而快速而准确的获得相关数据,加之整理与处理,检验与转化,可以为用户提供高质量的、有效的信息。如Robot到Web站点,将会构成最短路径,进而快速发现较多文档,便于应用;而HITS、PageRank及链接结构中增加Web内容信息,在模拟Web站点的拓扑结构,进而设置好Web页面的等级,如此可以使HITS、PageRank及链接结构更加快速地挖掘信息。   (2)Web内容挖掘。   Web内容挖掘是指从Web上的文件内容及其描述信息中获取潜在的、有价值的知识或模式的过程。从目前Web内容挖掘应用情况来看,其主要包括Web文本挖掘和Web多媒体挖掘,两者最大的区分是挖掘对象不同。Web文本挖掘,顾名思义是对Web上大量文档进行挖掘,挖掘过程中包括文档

您可能关注的文档

文档评论(0)

heroliuguan + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8073070133000003

1亿VIP精品文档

相关文档