- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于云计算的WEB数据挖掘关键技术的研究.doc
基于云计算的WEB数据挖掘关键技术的研究
摘要:Web数据挖掘技术也伴随着计算机技术的成熟和发展而在不断的进步和完善,它的运用范围也涉及各个领域,并起着重要的作用。云计算是数据存储的革命性突破,使得存储的能力和存储的安全性都得到很大的提高。从云计算着手分析Web的数据挖掘技术以及它所带来的影响,对计算机和互联网产业的发展都有重要的意义。该文分析云计算的特点结合Web技术,将云计算和Web数据挖掘放在同一纬度上进行深度的探究。
关键词:云计算;Web;数据挖掘;互联网
中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2016)16-0015-03
互联网是一个革命性的产业,它打破了人们的生活习惯和格局,同时随着互联网用户的不断增长,它的数据网络和数据信息也越来越详细和丰富。就如何在这样大数据之中提取出来有用的数据信息就是Web要做的工作,在大量数据挖掘出来后数据本身之间的关联性以及如何将这些挖掘的数据再次的运用到实际生活中这都是Web数据挖掘技术要突破和解决的问题。当前,大规模的数据在一个计算机上几乎无法操作了,科技发展和社会需求下的产物云计算应运而生,它处理和存储数据的能力非常强大,并具备对所存储的数据进行分析处理以及计算的超强能力。
1 云计算的应用及技术特征
1.1 云计算的应用现状
Web也是经历了一个漫长的成长和发展的过程。它在互联网技术和电子商务高速兴起的基础上,基于人们对网络的应用更加广泛和频繁,带动了Web2.0的一场兴起浪潮。数据的需求对互联网企业来说成为了竞争的核心内容,尤其是一些需要根据客户目的性需求而开设的网站,例如看网络视频的网站就更加的需要数据化来分析和开发有客户需求的产品。云计算的诞生解决了很多技术上的难题。我国的互联网用户非常庞大,且还处于增长的趋势,这就使得很多的大型企业和公司都在使用云计算来进行数据的分析和研究。
1.2 云计算技术分析
云计算主要就是对数据进行管理,它所处理的核心也就是数据,因此它和其他的计算机技术存在差异,具体如下:
一是,具有广泛性,云计算技术它最重要的就是存储技术,采取了大量分布存储的模式可以大大地提高存储的速度和存储的能力,同时也具备较高的性价比。它能够很精准的进行存储,非常实用。
二是,对数据的管理能力强,对大数据的跟踪监控具有时效性,并能够随时的处理数据分析数据,效率极高,也可以对数据库的信息和数据进行有针对性的筛选和查找,管理技术非常先进。
三是,应用到先进的编程技术,技术因素是云计算能不能达到良好用户体验的重要因素,它是支撑整个云计算系统良性高速运行的核心,这就需要整个的编程技术能够满足用户的需求和良好体验。目前Map-Reduce编程模式用得较多,它开始是以一个树枝的结构呈现出来的,分支后还将使用其他的编程模式来执行。
四是,虚拟化技术的灵活运用。云计算技术对虚拟化技术运用很广泛,虚拟化技术能够将计算资源进行合理的分配,它可以独立各个不同级别的系统,将各个系统进行独立化也将数据分成若干独立的部分,形成了一个动态的独立的分工体系。它使得整个的系统具有很大的弹性,能够很灵活的进行动态虚拟资源的使用,节约成本,由于他的结构的弹性和灵活性使得它能够降低管理的风险。
2 Web数据挖掘的发展现状
2.1 Web数据挖掘的概念
所谓的Web数据挖掘,即是Web、数据挖掘、计算机语言与信息学等技术与方法的融合,数据挖掘与Web得到融合之后,便能够体现出较好的综合性。对挖掘对象展开较为全面的分析之后,Web数据挖掘还可以被分为结构、内容与使用等多方面内容。其中,对于内容来说,其是指通过人工化模式组建,在Web环境下,从对应的文件夹当中,完成应用者信息的提取;对其结构来说,其是指通过人工化模式组建,对各种类型的结构实施挖掘,继而利用不同方式完成信息的提取;对于使用挖掘来讲,其是把被挖掘的对象集中在日志文件当中,然后以此为突破口,将站点用户量等数据展开挖掘。由此可见,数据挖掘也就是利用技术的手段来对Web文档中的数据进行提取,也就是根据现有的信息资源来进行分析和预测它的发展前景。Web数据挖掘技术并不是单一的某项技术而是多个技术的共同作用。
2.2 Web数据挖掘的分类
Web数据挖掘的分类方式有很多种,从它的兴趣类别来分可以分为下面三个部分,也就是Web数据挖掘的内容、结构和用法。从内容上说,就是Web数据挖掘的对象,也就是我们数据信息的载体,包括我们所获取的一些视频图片,音频文字等等的一些实质性的信息。内容的挖掘也可以细分的,主要就是分为纯文本的挖掘和多媒体的挖掘,这样细分能够更好的区别挖掘的对象。从Web数据挖掘的结构来说,就是获取这些
文档评论(0)