- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于Web的数据挖掘技术与相关研究.doc
基于Web的数据挖掘技术与相关研究
摘 要:在互联网应用日益广泛的今天,Web所涉及的服务越来越广泛,这使得Web上的信息量不断增多,大大增加了Web数据库系统的数据量。此种情况下,依旧采用传统方式方法来获取用户所需信息,需要消耗较多的时间,且难以保证信息的准确性,但基于Web的数据挖掘技术的应用,则可以快速的进行数据挖掘、数据处理、数据检验、数据转化,进而为用户提供所需信息。因此,基于Web的数据挖掘技术具有较高的应用价值,其目前在电子商务、网络教育、网站设计等多方面有很好的应用。基于此,该文将从分析数据挖掘技术及基于Web的数据挖掘技术展开,就基于Web的数据挖掘技术及应用予以研究。
关键词:Web 数据挖掘技术 相关研究
中图分类号:TP391 文献标识码:A 文章编号:1674-098X(2016)08(b)-0100-02
在互联网技术应用越来越广泛的情况下,互联网已经成为人们日常生活的一部分。基于此,互联网内容不断增多,信息过载现象日益明显。此种情况下,为了使人们的生活能够更加顺畅,及时且快速的获取到所需信息,需要科学、合理的运用基于Web的数据挖掘技术,充分发挥起作用,对数据进行深度的挖掘,进而有效地处理和检验数据,在此基础上将数据转化为完整的信息,供用户所用[1]。由此看来,在互联网内容不断增多,Web数据库系统的数据量不断增多的情况下,基于Web的数据挖掘技术的科学、合理应用是非常重要的,可以帮助用户快速获取所需信息。
1 数据挖掘技术及基于Web的数据挖掘技术
1.1 数据挖掘技术
数据挖掘技术是为了方便人们在大量的数据中快速、正确的找到自己想要的信息而应运而生的技术。在现代化的今天,数据挖掘技术的应用日益广泛,尤其是在计算机技术和数据特征的支持下所构建的数据挖掘系统,可以确定数据挖掘目标,在此基础上以数据库为挖掘对象,从中挖掘所需数据,再对数据进行预处理和再加工,进而检查数据的完整性,确定数据完整的情况下会将其转化成可以被理解的信息,供用户应用。所以,在现代化的今天,人们对信息需求越来越大的情况下,数据挖掘技术的研究与应用是非常有意义的[2]。
1.2 基于Web的数据挖掘技术
1.2.1 基于Web的数据挖掘技术的概述
基于Web的数据挖掘技术,简单来说就是将数据挖掘技术应用到Web上。在现代化的今天,Web所涉及的服务越来越广泛,这使得Web上的信息量不断增多,此种情况下,有效的利用数据挖掘技术,可以对用户所需信息的相关数据挖掘、处理,进而转化为信息供用户应用。
1.2.2 基于Web的数据挖掘的特点
在Web所涉及业务越来越广泛的情况下,Web上的数据量不断增多,直接存在庞大的数据库系统之中。此种情况下,用户需要使用所需信息,就需要在Web的数据库系统中进行数据挖掘,但因数据库系统中的数据量较多,利用传统的方式方法难以快速且准确的找到所需信息。但基于Web的数据挖掘技术的应用则不同,其结构模式不严格,可以灵活的运用,在数据库系统中进行数据挖掘与处理,进而转化为用户所需信息。另外,基于Web的数据挖掘技术适应Web环境且在Web上应用,因此在设置Web数据挖掘时是结合了Web的实际情况,因此基于Web的数据挖掘与Web的特点相贴合,所以,基于Web的数据挖掘具有动态性、异构性、灵活性、有效性等特点[3]。
1.2.3 基于Web的数据挖掘的分类
从目前基于Web的数据挖掘应用实际情况来看,基于Web的数据挖掘主要分为Web结构挖掘、Web内容挖掘及Web访问挖掘3类。
(1)Web结构挖掘。
Web结构包括不同网页之间的超链接结构和一个页面内部的树形结构,以及文档URL中的目录路径结构等。Web结构挖掘的使用,将会把Web表示成一个有向图,图中的点对应的是Web的页面、图的边对应的是Web的超级链接,此种情况下,可以获得一个站点的主页到任意一个定点的最短路径,进而快速而准确的获得相关数据,加之整理与处理,检验与转化,可以为用户提供高质量的、有效的信息。如Robot到Web站点,将会构成最短路径,进而快速发现较多文档,便于应用;而HITS、PageRank及链接结构中增加Web内容信息,在模拟Web站点的拓扑结构,进而设置好Web页面的等级,如此可以使HITS、PageRank及链接结构更加快速地挖掘信息。
(2)Web内容挖掘。
Web内容挖掘是指从Web上的文件内容及其描述信息中获取潜在的、有价值的知识或模式的过程。从目前Web内容挖掘应用情况来看,其主要包括Web文本挖掘和Web多媒体挖掘,两者最大的区分是挖掘对象不同。Web文本挖掘,顾名思义是对Web上大量文档进行挖掘,挖掘过程中包括文档
您可能关注的文档
- 基于LabVIEW雏鸡雌雄半自动鉴别系统.doc
- 基于LDA与距离度量学习的文本分类研究.doc
- 基于LDA模型的95598热点业务工单挖掘分析.doc
- 基于LNS和COM的LonWorks网络监控软件开发.doc
- 基于LS―DYNA的某汽车乘客安全气囊支架焊接强度的分析.doc
- 基于Matlab与Spss的统计方法与统计思维研究.doc
- 基于MATLAB的脑电信号带通滤波器的仿真与比较.doc
- 基于MATLAB软件的网络媒体中大数据技术.doc
- 基于MC9S12XS128单片机的智能小车设计系统.doc
- 基于Moodle教学在线的大学数学课程翻转课堂教学实践.doc
- 2025年分红险:低利率环境下产品体系重构.pdf
- 大学生职业规划大赛《应用物理学专业》生涯发展展示PPT.pptx
- 大学生职业规划大赛《新媒体技术专业》生涯发展展示PPT.pptx
- 七年级上册英语同步备课(人教2024)Unit 3 课时2 Section A(2a-2f)(同步课件).pdf
- 七年级上册英语同步备课(人教2024)Unit 2 课时4 Section B(1a-1d)(同步课件).pdf
- 七年级上册英语同步备课(人教2024)Unit 3课时6 project(课件).pdf
- 2025年港口行业报告:从财务指标出发看港口分红提升潜力.pdf
- 2023年北京市海淀区初一(七年级)下学期期末考试数学试卷(含答案).pdf
- 2026年高考化学一轮复习第7周氯及其化合物、硫及其化合物.docx
- 2023年北京市西城区北京四中初一(七年级)下学期期中考试数学试卷(含答案).pdf
文档评论(0)