课后作业答案云计算与大数据课案.docx

  1. 1、本文档共15页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
课后作业答案云计算与大数据课案

第一章1.硬件驱动力网络驱动力2.西摩·克雷(Seymour Cray)3.约翰·麦卡锡4.蒂姆·博纳斯·李5.吉姆·格雷6.Java7.基础设施即服务平台即服务软件即服务8.(1) 超大规模  “云”具有相当的规模,Google云计算已经拥有100多万台服务器, Amazon、IBM、微软、Yahoo等的“云”均拥有几十万台服务器。企业私有云一般拥有数百上千台服务器。“云”能赋予用户前所未有的计算能力。  (2) 虚拟化  云计算支持用户在任意位置、使用各种终端获取应用服务。所请求的资源来自“云”,而不是固定的有形的实体。应用在“云”中某处运行,但实际上用户无需了解、也不用担心应用运行的具体位置。只需要一台笔记本或者一个手机,就可以通过网络服务来实现我们需要的一切,甚至包括超级计算这样的任务。  (3) 高可靠性  “云”使用了数据多副本容错、计算节点同构可互换等措施来保障服务的高可靠性,使用云计算比使用本地计算机可靠。  (4) 通用性  云计算不针对特定的应用,在“云”的支撑下可以构造出千变万化的应用,同一个“云”可以同时支撑不同的应用运行。  (5) 高可扩展性  “云”的规模可以动态伸缩,满足应用和用户规模增长的需要。  (6) 按需服务  “云”是一个庞大的资源池,你按需购买;云可以像自来水,电,煤气那样计费。  (7) 极其廉价  由于“云”的特殊容错措施可以采用极其廉价的节点来构成云,“云”的自动化集中式管理使大量企业无需负担日益高昂的数据中心管理成本,“云”的通用性使资源的利用率较之传统系统大幅提升,因此用户可以充分享受“云”的低成本优势,经常只要花费几百美元、几天时间就能完成以前需要数万美元、数月时间才能完成的任务。  云计算可以彻底改变人们未来的生活,但同时也要重视环境问题,这样才能真正为人类进步做贡献,而不是简单的技术提升。  (8) 潜在的危险性云计算服务除了提供计算服务外,还必然提供了存储服务。但是云计算服务当前垄断在私人机构(企业)手中,而他们仅仅能够提供商业信用。对于政府机构、商业机构(特别像银行这样持有敏感数据的商业机构)对于选择云计算服务应保持足够的警惕。一旦商业用户大规模使用私人机构提供的云计算服务,无论其技术优势有多强,都不可避免地让这些私人机构以“数据(信息)”的重要性挟制整个社会。对于信息社会而言,“信息”是至关重要的。另一方面,云计算中的数据对于数据所有者以外的其他用户云计算用户是保密的,但是对于提供云计算的商业机构而言确实毫无秘密可言。所有这些潜在的危险,是商业机构和政府机构选择云计算服务、特别是国外机构提供的云计算服务时,不得不考虑的一个重要的前提。9.MPI、Hadoop、HPCC、StormKVM、VMware10.(1)数据查询分析计算系统HBase:开源、分布式、面向列的非关系型数据库模型,是Apache的Hadoop项目的子项目,实现了压缩算法、内存操作和布隆过滤器。(2)批处理系统:MapReduce是被广泛使用的批处理计算模式。MapReduce对具有简单数据关系、易于划分的大数据采用“分而治之”的并行处理思想,讲数据记录的处理分为Map和Reduce两个简单的抽象操作,提供了一个统一的并行计算框架。(3)流式计算机系统:流式计算机具有很强的实时性,需要对应用源源不断产生的数据实时进行处理,是数据不积压、不丢失,常用于处理电信、电力等行业应用以及互联网行业的访问日志等。(4)迭代计算系统:针对MapReduce不支持迭代计算的缺陷,人民对Hadoop进行了大量改进。(5)图计算系统:社交网络、网页链接等包含具有复杂关系的图数据,这些图数据规模巨大,可包含数十亿顶点和上百亿条边,图数据需要有专门的系统进行存储和计算。(6)内存计算系统:随着内存价格的不断下降、服务器可配置内存容量的不断增长,使用内存计算完成高速的大数据处理已成为大数据处理的重要发展方向。11. 大数据处理需要有三个基本的环节和五个方面的工作。首先要有“数据采集”的方法和途径(采集);其次要用符合教育原理的数据处理方法(建模);另外,还要有“数据还原现象”综合方法(还原)。其中,还有“数据清理”、“数据汇聚”等技术处理工作。在整个大数据处理过程中,还需要考虑“数据安全”和“隐私保护”等问题。第二章1.对key值首先用MD5算法将其变换为一个长度32位的十六进制数值,再用这个数值对2的32次方取值,将其映射到2的32次方个值构成的环状哈希空间,对节点也以相同的方法映射到环状哈希空间中找到大于它的最小节点值作为路由值。2.思辨研究范式  批判研究范式  行动研究范式实证研究范式3.物联网产业链可细分为标识、感知、处理和信息传送4个环节4. Column-Oriented、Key-Value、Documen

文档评论(0)

jiayou10 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8133070117000003

1亿VIP精品文档

相关文档