基于粒计算大数据处理技术探析.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于粒计算大数据处理技术探析

基于粒计算大数据处理技术探析   摘 要:全面应对大数据的挑战需要来自存储技术、下一代网络、处理器、计算模型等各个领域的创新,粒计算是在求解问题过程中使用“粒”的理论、方法、技术和工具的集合,适用于近似求解有不确定性和层次结构的问题。文章综述了大数据处理的研究现状,分析了当前大数据处理研究存在的局限性,根据运用粒计算方法解决问题的不同特征,归纳了粒计算的3种基本模式,回顾了各种模式的相关研究工作,讨论了粒计算应用于大数据处理的可行性与优势,并探讨了在大数据的粒计算处理框架中需要解决的各个关键问题。   关键词:大数据;粒计算;数据信息   随着人工智能技术的不断深入发展、数据网络技术的普及、信息终端设备的多样化,当代信息网路己逐步向“大数据”时代发展。未来一定是数据信息大爆炸的时代,信息将是社会进步发展、市场竞争、其他社会事业、国家事业进步和发展的核心。基于上述背景,云计算技术、粒计算技术应运而生,对大数据的整合、处理、管理起到至关重要的推动作用。作者从大数据背景为切入点对大数据时代和粒计算技术进行论述.并简要分析粒计算技术在大数据中的应用。   1 大数据   1.1大数据的定义   大数据是基于现代电子信息工程下的一种新型概念,其旨在利用数量庞大、搜索速度迅速、价值密度较高、信息多样全面、信息真实可靠的数据集合实现数据信息的捕捉、管理和处理,从而提高数据使用者的决策力、洞察发现力和流程优化能力,进而实现数据信息的有效利用。 从长远的战略意义来看,大数据并不意味着掌握庞大丰富的数据信息,从某种意义上来说,是将这些基础的数据内容进行有效的专业化处理,从而实现价值转化,将之称作一种产业更为适当,也因此大数据在技术层面上需要与云计算结合使用。   1.2大数据处理技术以及局限性   大数据的处理技术可以概括为数据采集技术、数据分析技术和数据管理技术3个方面。由于大数据属于新兴的概念性信息技术理念,其很多技术是从“小数据”移植而来,那么必然存在相应的局限性,主要可概括为以下几点。首先,数据采集难度上升,大数据是基于海量的有效信息才能实现,然而从数据来源上来说,网络中存在大量的虚假信息,无法排除终端使用者故意上传虚假信息或危险数据。此外,一些终端使用者的数据信息需求可能涉及相关的隐私,如商业隐私、个人隐私等,在数据网络安全无法完全保证时,出于安全考虑很难要求这些可能涉密涉私的问题实现有效共享。其次,数据分析难度提高对技术的需求更高。大数据的背景下,需要更加可靠的计算机信息网络系统进行支持的同时,由于信息量的海量增长,传统的小规模服务器组可以实现的数据分析和检索机制无法与大数据的发展速度相适应,因此,需要进一步完善云?算技术与之配合。最后,数据管理技术上的局限性,大数据平台的拓展使每一个相对独立的数据终端接收和存储的数据容量上升,管理工作的工作量也随之上升,传统的小型服务器组、数据库己无法满足相应需求,这也是大数据数据信息混杂的一个重要原因。   2 粒计算研究与应用   2.1粒与粒算的方法   现阶段的粒计算方法主要可概括为以下3种方法:词计算理论、粗糙集理论、商空间理论,上述3种方法是基于人工智能研究中3种思维模式产生的理论方法。 词计算理论是基于不知道原则、不需要原则、无法定义原则和无法解决原则而进行的以自然语言的“词”或“句”为操作对象的计算范式,因此,词计算作为粒计算的一种方式,其是以人类感知为限度的外在表现来完成的感知计算理论。   粗糙集理论作为一种处理不精确、不一致、不完整等各种不完备信息的有效工具,一方面得益于他的数学基础成熟、不需要先验知识;另一方面在于它的易用性。由于粗糙集理论创建的目的和研究的出发点就是直接对数据进行分析和推理,从中发现隐含的知识,揭示潜在的规律,因此是一种天然的数据挖掘或者知识发现方法,它与基于概率论的数据挖掘方法、基于模糊理论的数据挖掘方法和基于证据理论的数据挖掘方法等其他处理不确定性问题理论的方法相比较,最显著的区别是它不需要提供问题所需处理的数据集合之外的任何先验知识,而且与处理其他不确定性问题的理论有很强的互补性。   商空间理论是从近代代数的环、群概念中衍化而来的一种粒计算方法。简单来说就是构建相应的商空间后通过拓扑的方法将其扩大化,以拓扑空间和等价空间共同构建商空间,从而形成一种相对全面但较为模糊的空间集,将终端需求的信息和相关信息进行分类采集,从而实现信息的粒计算。   2.2粒计算的研究与大数据处理   根据粒计算的上述方法与概念,可以看到,粒计算应用于大数据处理中存在2个基本问题:粒化和基于粒化的计算。即如何构造这个模型,以及根据这个模型的计算。粒化,是问题空间的一个划分过程,转化到大数据处理中就是将数据模糊粒化计算的参考是什么,这是实现大数据

文档评论(0)

erterye + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档