计算机专业英语 第3版 课件 u10 Big Data.ppt

计算机专业英语 第3版 课件 u10 Big Data.ppt

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

计算机专业英语(第三版)

BigDataUnit10

ContentsNewWordsAbbreviationsPhrasesNotes参考译文

NewWords

NewWords

NewWords

NewWords

Phrases

Phrases

Abbreviations

Notes

Notes

Notes

Notes

Notes

ListeningtoTextA

大数据1.定义大数据是用来描述公司产生的浩繁的非结构化和半结构化数据的一个通用术语——要把这些数据加载到关系型数据库来分析会耗费大量时间和大量资金。虽然大数据并没有涉及任何具体数量,通常在谈论拍字节和艾字节时使用该术语。观察大数据的一个主要目标是发现可重复的业务模式。人们普遍承认,非结构化数据,其中大部分在文本文件中,占一个组织中至少有80%的数据。如果不加管理,企业每一年产生的全部非结构化数据会花费巨额的存储费用。如果审计或诉讼时不能找到信息,不加管理的非结构化数据也可能会带来法律责任。大数据分析往往是与云计算相关,因为实时分析大型数据集需要像MapReduce这样的一个框架来将任务分布到数十台、几百台甚至上千台的计算机上。参考译文

2.大数据分析大数据分析研究大量的多种类型的数据,以揭示隐藏的模式、未知的相互关系及其他有用的信息。这些信息可以提供有竞争力的优势以超过对手组织,产生商业利益,例如更有效地营销和增加收入。大数据分析的主要目标是,让数据科学家和其他用户分析数量巨大的业务数据以及可能没有被传统的商业智能(BI)程序利用的其它数据源来帮助企业做出更好的业务决策。这些其他的数据源可能包括Web服务器日志和互联网点击流数据、社交媒体活动报告、移动电话的呼叫详细记录和传感器捕获的信息。有些人专门对这类的非结构化数据进行大数据分析,而像Gartner公司和Forrester研究公司这样的咨询公司也把业务数据和其他结构化数据当作有效的大数据形式。参考译文

可以用软件工具进行大数据分析。这些工具通常作为高级分析学科的一部分,如预测分析和数据挖掘。但用于大数据分析的非结构化数据源可能不适合于传统的数据仓库。此外,传统的数据仓库可能无法满足由大数据所带来的需求。因此,一类新的大数据技术已经出现并正在很多大数据分析环境中使用。与大数据分析相关的技术包括NoSQL数据库、Hadoop和MapReduce。这些技术构成了支持集群系统中大数据集的处理开源软件框架的核心。组织在大数据分析项目上可能遇到的困难包括缺乏内部的分析技能和聘用经验丰富分析专家的高额成本,虽然厂商开始提供这些技术之间的软件接口,但把Hadoop系统与数据仓库加以整合也颇具挑战性。参考译文

参考译文3.大数据管理大数据管理是对大量结构化和非结构化数据的组织、管理和治理。大数据管理的目标是确保高水平的数据质量、商业智能的可用性和大数据分析应用。企业、政府机构和其他组织采用大数据管理策略,以帮助他们与快速增长的数据池相抗衡,通常涉及千兆字节级甚至拍字节级的用不同文件格式保存的信息。有效的大数据管理帮助企业从各种非结构化和半结构化的数据集找到有价值的信息,包括通话详细记录、系统日志和社交媒体网站。大多数大数据环境超出了关系型数据库和传统的数据仓库平台,融入了适应处理和存储非传统的数据的技术。日益注重收集和分析大数据正在产生新一些平台,这些平台把传统数据仓库与用逻辑数据仓库构建的大数据系统相结合。作为这一进程的一部分,必须决定哪些数据合格、哪些数据可以处理、哪些数据应该被保存和分析,以改善目前的业务流程或提供业务的竞争优势。这个过程需要细致的数据分类,以便最终能够对较小的数据集进行快速而高效的分析。

4.大数据即服务(BDaaS)大数据即服务(BDaaS)是由外部提供商提供的统计分析工具或信息,以帮助企业了解并使用从大量信息集中获得的数据以获得竞争优势。鉴于定期产生的非结构化数据的数量巨大,BDaaS利用外部供应商的预测分析技能来管理和评估大型数据集以释放组织资源,而不是雇用内部员工来实现这类功能。它可以通过采用数据处理软件或与数据科学家签订服务合同的形式来实现。BDaaS是管理服务的一种形式,类似于软件即服务或基础架构即服务。它往往依赖于云存储来保持这些信息拥有者和使用信息的提供者进行连续的数据访问。参考译文

5.非结构化数据非结构化数据是描述任何不在数据库中的企业信息的通用标签。非结构化数据可以是文本的或非文本的。文本非结构化数据产生于电子邮件、PowerPoint演示文稿、Word文档、协作软件和即时消息这样的媒体。非文本非结构化数据产生于JPEG图像、MP3音频文件和Flash视频文件这样的媒体。非结构化数据中包含的信息并不总是很容易找到的。它要求可以扫描电子和

文档评论(0)

balala11 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档