基于Web的数据挖掘技术与相关研究.docVIP

下载本文档

0
0
约 6页
2017-08-25 发布于北京
举报
版权申诉

基于Web的数据挖掘技术与相关研究.doc

1、本文档共6页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于Web的数据挖掘技术与相关研究.doc

基于Web的数据挖掘技术与相关研究　　摘要：在互联网应用日益广泛的今天，Web所涉及的服务越来越广泛，这使得Web上的信息量不断增多，大大增加了Web数据库系统的数据量。此种情况下，依旧采用传统方式方法来获取用户所需信息，需要消耗较多的时间，且难以保证信息的准确性，但基于Web的数据挖掘技术的应用，则可以快速的进行数据挖掘、数据处理、数据检验、数据转化，进而为用户提供所需信息。因此，基于Web的数据挖掘技术具有较高的应用价值，其目前在电子商务、网络教育、网站设计等多方面有很好的应用。基于此，该文将从分析数据挖掘技术及基于Web的数据挖掘技术展开，就基于Web的数据挖掘技术及应用予以研究。　　关键词：Web 数据挖掘技术相关研究　　中图分类号：TP391 文献标识码：A 文章编号：1674-098X（2016）08（b）-0100-02 　　在互联网技术应用越来越广泛的情况下，互联网已经成为人们日常生活的一部分。基于此，互联网内容不断增多，信息过载现象日益明显。此种情况下，为了使人们的生活能够更加顺畅，及时且快速的获取到所需信息，需要科学、合理的运用基于Web的数据挖掘技术，充分发挥起作用，对数据进行深度的挖掘，进而有效地处理和检验数据，在此基础上将数据转化为完整的信息，供用户所用[1]。由此看来，在互联网内容不断增多，Web数据库系统的数据量不断增多的情况下，基于Web的数据挖掘技术的科学、合理应用是非常重要的，可以帮助用户快速获取所需信息。　　1 数据挖掘技术及基于Web的数据挖掘技术　　1.1 数据挖掘技术　　数据挖掘技术是为了方便人们在大量的数据中快速、正确的找到自己想要的信息而应运而生的技术。在现代化的今天，数据挖掘技术的应用日益广泛，尤其是在计算机技术和数据特征的支持下所构建的数据挖掘系统，可以确定数据挖掘目标，在此基础上以数据库为挖掘对象，从中挖掘所需数据，再对数据进行预处理和再加工，进而检查数据的完整性，确定数据完整的情况下会将其转化成可以被理解的信息，供用户应用。所以，在现代化的今天，人们对信息需求越来越大的情况下，数据挖掘技术的研究与应用是非常有意义的[2]。　　1.2 基于Web的数据挖掘技术　　1.2.1 基于Web的数据挖掘技术的概述　　基于Web的数据挖掘技术，简单来说就是将数据挖掘技术应用到Web上。在现代化的今天，Web所涉及的服务越来越广泛，这使得Web上的信息量不断增多，此种情况下，有效的利用数据挖掘技术，可以对用户所需信息的相关数据挖掘、处理，进而转化为信息供用户应用。　　1.2.2 基于Web的数据挖掘的特点　　在Web所涉及业务越来越广泛的情况下，Web上的数据量不断增多，直接存在庞大的数据库系统之中。此种情况下，用户需要使用所需信息，就需要在Web的数据库系统中进行数据挖掘，但因数据库系统中的数据量较多，利用传统的方式方法难以快速且准确的找到所需信息。但基于Web的数据挖掘技术的应用则不同，其结构模式不严格，可以灵活的运用，在数据库系统中进行数据挖掘与处理，进而转化为用户所需信息。另外，基于Web的数据挖掘技术适应Web环境且在Web上应用，因此在设置Web数据挖掘时是结合了Web的实际情况，因此基于Web的数据挖掘与Web的特点相贴合，所以，基于Web的数据挖掘具有动态性、异构性、灵活性、有效性等特点[3]。　　1.2.3 基于Web的数据挖掘的分类　　从目前基于Web的数据挖掘应用实际情况来看，基于Web的数据挖掘主要分为Web结构挖掘、Web内容挖掘及Web访问挖掘3类。　　（1）Web结构挖掘。　　Web结构包括不同网页之间的超链接结构和一个页面内部的树形结构，以及文档URL中的目录路径结构等。Web结构挖掘的使用，将会把Web表示成一个有向图，图中的点对应的是Web的页面、图的边对应的是Web的超级链接，此种情况下，可以获得一个站点的主页到任意一个定点的最短路径，进而快速而准确的获得相关数据，加之整理与处理，检验与转化，可以为用户提供高质量的、有效的信息。如Robot到Web站点，将会构成最短路径，进而快速发现较多文档，便于应用；而HITS、PageRank及链接结构中增加Web内容信息，在模拟Web站点的拓扑结构，进而设置好Web页面的等级，如此可以使HITS、PageRank及链接结构更加快速地挖掘信息。　　（2）Web内容挖掘。　　Web内容挖掘是指从Web上的文件内容及其描述信息中获取潜在的、有价值的知识或模式的过程。从目前Web内容挖掘应用情况来看，其主要包括Web文本挖掘和Web多媒体挖掘，两者最大的区分是挖掘对象不同。Web文本挖掘，顾名思义是对Web上大量文档进行挖掘，挖掘过程中包括文档