2025年第1章大数据技术教程-大数据技术概述 .pdfVIP

2025年第1章大数据技术教程-大数据技术概述 .pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

好学近乎知,力行近乎仁,知耻近乎勇。——《中庸》

第一章大数据技术概述

1.1大数据的概念

近几年来,互联网技术飞速发展,特别是社交网络、物联网、云计算、雾计算技术的兴

起与普及,以及各种传感器的广泛应用,数量庞大、种类众多、时效性强的非结构化数据成

指数级增长,传统的数据存储、分析技术在实时处理大量的非结构化信息时遇到瓶颈,大数

据的概念应运而生。到底什么是大数据?大数据的特征是什么?大数据与传统上的数据有哪

些不同特性?大数据具有哪些应用价值?大数据通常的处理技术有哪些?针对这些问题,我

们将在本教程中逐一探讨。

1.1.1什么是大数据

在探讨什么是大数据前,我们先来了解一下什么是数据。

传统意义上的数据是对客观事物的逻辑归纳,是事实或观察的结果,是用于表示客观事

物的未经加工的“有根据的数字”。数据源于测量,是对客观世界测量结果的记录。人类一

切语言文字、图形图画、音像记录,所有感官可以察觉的事物,只要能被记下来,能够查询

到,就都是数据(data)。当人类进入信息时代之后,数据是一切能输入计算机并被计算机程

序处理,具有一定意义的数字、字母、符号和模拟量等的通称。数据可以是连续的值,比如

声音、图像,称之为模拟数据;它也可以是离散的,如符号、文字,称之为数字数据。在现

代计算机系统中,所有的数据都是数字的。数字数据是所有数据中最容易被处理的一种,许

多和数据相关的概念,都是立足于数字数据。传统意义上的数据一词,尤其是相对于今天的

“大数据”的“小数据”,主要指的就是数字数据,甚至在很多情况下专指统计数字数据,

这些数字数据用来描述某种客观事物的属性。

大数据属于数据范畴,在类型上涵盖模拟数据和数字数据,在体量方面,具有数据庞大

的特征,在数据处理方式,与传统的数据处理方式有所不同。人们在早些年习惯把规模庞大

的数据称为“海量数据”,但实际上,大数据(BigData)这个概念在2008年就已经被提

出。2008年,在Google公司成立10周年之际,著名的《自然》杂志专门出版了一期专刊,

讨论大数据相关的一系列技术问题,其中就提出了大数据(BigData)的概念。

长风破浪会有时,直挂云帆济沧海。——李白

随着对大数据越来越多的了解,人们常常会问,究竟怎样的数据才能称作大数据?其实,

关于大数据的定义,难以有一个非常准确的说法。维基百科给出了一个关于大数据的描述:

大数据是指无法使用传统和常用的软件技术和工具在一定时间内完成获取、管理和处理的数

据集。国内学者给出的定义:大数据是综合利用新的技术方法对多源、异构、动态的数字资

源进行规模化的整合和处理,通过构成新的、复杂的逻辑机构以帮助人们解决具体问题的信

息集成。

总的来说,大数据是指涉及的数据规模巨大到无法通过人工或计算机,在合理的时间内

达到截取、管理、处理并整理成为人们所能解读的形式的信息。

其实,如今“大数据”一词的重点已经不仅在于数据规模的定义,它更多的是代表着计

算机以及信息技术发展进入了一个新的时代,代表着大数据处理所需要的新技术和新方法,

也代表着大数据分析和应用所带来的新发明、新服务和新的发展机遇。

大数据技术是新兴的,能够高速捕获、分析、处理大容量多种类型数据,并从中得到相

应的技术和架构。大数据处理的关键技术主要包括:数据采集和预处理、数据存储、基础架

构、数据分析和挖掘以及大数据应用。

大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行

专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提

高对数据的“加工能力”,通过

文档评论(0)

158****6638 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档