大数据专业名词解释光环大数据培训.pdfVIP

大数据专业名词解释光环大数据培训.pdf

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
光环大数据--大数据培训知名品牌 大数据专业名词解释_光环大数据培训 01 算法(Algorithm) 算法可以理解成一种数学公式或用于进行数据分析的统计学过程。那么,「算 法」又是何以与大数据扯上关系的呢?要知道,尽管算法这个词是一个统称,但 是在这个流行大数据分析的时代,算法也经常被提及且变得越发流行。 02 分析(Analyticsanalyze) 让我们试想一个很可能发生的情况,你的信用卡公司给你发了封记录着你全 年卡内资金转账情况的邮件,如果这个时候你拿着这张单子,开始认真研究你在 食品、衣物、娱乐等方面消费情况的百分比会怎样?你正在进行分析工作,你在 从你原始的数据(这些数据可以帮助你为来年自己的消费情况作出决定)中挖掘 有用的信息。 那么,如果你以类似的方法在推特和脸书上对整个城市人们发的帖子进行处 理会如何呢?在这种情况下,我们就可以称之为大数据分析。所谓大数据分析, 就是对大量数据进行推理并从中道出有用的信息。以下有三种不同类型的分析方 法,现在我们来对它们分别进行梳理。 03 描述性分析法(DescriptiveAnalytics) 如果你只说出自己去年信用卡消费情况为:食品方面25%、衣物方面35%、 娱乐方面20%、剩下20%为杂项开支,那么这种分析方法被称为描述性分析法。 当然,你也可以找出更多细节。 04 预测性分析法(PredictiveAnalytics) 如果你对过去5 年信用卡消费的历史进行了分析,发现每年的消费情况基本 上呈现一个连续变化的趋势,那么在这种情况下你就可以高概率预测出:来年的 消费状态应该和以往是类似的。这不是说我们在预测未来,而是应该理解为,我 们在「用概率预测」可能发生什么事情。在大数据的预测分析中,数据科学家可 能会使用先进的技术,如机器学习,和先进的统计学处理方法(这部分后面我们 会谈到)来预测天气情况、经济变化等等。 光环大数据 光环大数据--大数据培训知名品牌 05 规范性分析(PrescriptiveAnalytics) 这里我们还是用信用卡转账的例子来理解。假如你想找出自己的哪类消费 (如食品、娱乐、衣物等等)可以对整体消费产生巨大影响,那么基于预测性分析 (PredictiveAnalytics)的规范性分析法通过引入「动态指标(action)」(如减少 食品或衣物或娱乐)以及对由此产生的结果进行分析来规定一个可以降低你整体 开销的最佳消费项。你可以将它延伸到大数据领域,并想象一个负责人是如何通 过观察他面前多种动态指标的影响,进而作出所谓由「数据驱动」的决策的。 06 批处理(Batchprocessing) 尽管批量数据处理从大型机(mainframe)时代就已经存在了,但是在处理大 量数据的大数据时代面前,批处理获得了更重要的意义。批量数据处理是一种处 理大量数据(如在一段时间内收集到的一堆交易数据)的有效方法。分布式计算 (Hadoop),后面会讨论,就是一种专门处理批量数据的方法。 07Cassandra 是一个很流行的开源数据管理系统,由ApacheSoftwareFoundation 开发并 运营。Apache 掌握了很多大数据处理技术,Cassandra 就是他们专门设计用于在 分布式服务器之间处理大量数据的系统。 08 云计算(Cloudcomputing) 虽然云计算这个词现在已经家喻户晓,这里大可不必赘述,但是为了全篇内 容完整性的考虑,笔者还是在这里加入了云计算词条。本质上讲,软件或数据在 远程服务器上进行处理,并且这些资源可以在网络上任何地方被访问,那么它就 可被称为云计算。 09 集群计算(Clustercomputing) 这是一个来描述使用多个服务器丰富资源的一个集群(cluster)的计算的形 象化术语。更技术层面的理解是,在集群处理的语境下,我们可能会讨论节点 (node)、集群管理层(clustermanagementlayer)、负载平衡(loadbalancing)和 并行处理(parallelproc

文档评论(0)

186****8818 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档