网站大量收购闲置独家精品文档,联系QQ:2885784924

第二讲提高数据处理能力意识总动员.ppt

  1. 1、本文档共27页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二讲提高数据处理能力意识总动员

提高现代数据处理意识与处理能力总动员 大数据时代谈数据处理重要性 源自维基百科的大数据(big data)介绍(1) Big data[1][2] 是一系列的数据集的集合其之大之复杂导致传统数据处理方法和现场的数据管理工来处理变得很具有挑战性。 有以下三方面的挑战: capture, curation, storage,[3] search, sharing, transfer, analysis,[4] visualization. 研究大数据的动机在于要获得比分析单个数据集多得多的额外信息。 与分散研究相比,同样的数据协同研究会得到潜在的相关性,有可能发现 商业网点的倾向。从而提高研究的品质。 prevent diseases, link legal citations, combat crime, and determine real-time roadway traffic conditions.“[5][6][7] 都是大数据时代的新问题。 源自维基百科的大数据(big data)介绍(2) 到了 2012, 对于数据规模的限制(limits on the size of data sets )的要求已经提上了议事日程。[8][9] 如下领域:气象学、染色体、通讯、复杂物理模拟,生物和环境工程(meteorology, genomics,[10] connectomics, complex physics simulations,[11] and biological and environmental research.[12])互联网、金融、商业(Internet search, finance and business informatics)都不得不对数据规模限制。 数据大规模增长主要因为无处不在的信息传感器空中遥感技术(ubiquitous information-sensing mobile devices, aerial sensory technologies), 还有software logs, cameras, microphones, radio-frequency identification readers, and wireless sensor networks.[13][14] 从 1980s [15] 起,平均每40个月涨一倍,而到了 2012, every day 2.5 quintillion (2.5×1018) bytes of data were created.[16] The challenge for large enterprises is determining who should own big data initiatives that straddle the entire organization.[17] 大数据(big data)介绍(3) Big data is difficult to work with using most relational database management systems and desktop statistics and visualization packages, requiring instead massively parallel software running on tens, hundreds, or even thousands of servers.[18] What is considered big data varies depending on the capabilities of the organization managing the set, and on the capabilities of the applications that are traditionally used to process and analyze the data set in its domain. For some organizations, facing hundreds of gigabytes of data for the first time may trigger a need to reconsider data management options. For others, it may take tens or hundreds of terabytes before data size becomes a significant consideration.[19] 大数据的定义 Big data usually includes

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档