- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
?
?
云计算环境下的大规模图数据处理技术研究
?
?
赵威
摘要本文简要分析了云计算的概念,论述云计算图数据储存的方法、分割的原理,建立相关的计算模型。
关键词云计算;大规模图数据;处理技术
TP3A1674-6708(2017)196-0053-02
在计算机技术应用的环节中,图是一类非常重要的数据,其形成了一个非常抽象的数据结构,比常规的线性语言,其在语言表达方面也更加的复杂。随着时代的发展,科学技术水平在不断的提升,图数据实现了大规模的处理,相关的处理技术也应该更新换代,才能跟上时代的发展。所以,我们应该充分的了解云计算的概念,在云计算的背景下,实现大规模图数据的处理。
1云计算简介
1.1云计算的含义
云计算指的是在互联网发展的基础上,研发出的一类全新的计算方法,是依托了互联网技术实现了大量数据的整合。在2007年,云计算概念首先由美国的IBM公司提出,其将云计算定义为一个具体的系统平台和应用程序。
1.2云计算的主要特征
1.2.1虚拟化
用户可以在网络环境下采用不同的工具使用云计算的服务,及时的完成各类计算的任务。云计算服务器一般以群集的方式提供各类服务,而且其一般都是以虚拟的形式存在,并不存在实体。
1.2.2通用性和可拓展性
云计算有大量的群集系统的支持,所以,这个平台可以为用户提供不同的服务,不仅仅可以为用户特定的应用,而且也能根据客户不同的需求,确保各类应用同时运行。云计算群集的处理方式体现了良好的伸缩性能,可以动态的展现各类功能,即使应用的规模比较大,也能实现良好的可扩展性。
1.2.3经济性高
云计算要结合大量的计算机任务,所以,群体的规模非常大,云计算服务可以同时针对谷歌的云计算平台进行服务,可以为200万台计算机同时提供服务,也能为其他的供应商提供服务,如微软、雅虎都能接受云计算的服务,用户在云计算群集中可以获得大量的资源。云计算群集服务器使用的设备的成本都比较低,而且计算机本身的容错能力非常好,可以建立成本低廉的服务,这一点充分展现了云計算的成本优势,而且也促进了其全面的推广。
1.3云计算的相关技术
1.3.1海量分布式存储技术
在云计算应用中,要对大量的数据进行存储,这时离不开分布式存储技术的应用,其可以提高数据的精确性和经济性。借助各类新型软件的研发,可以有效的弥补硬件能力不足的问题,云计算系统的用户群体非常的庞大,所以,就需要大量数据的支撑,用户对数据传输的速率提出了更高的要求。只有提升数据存储的能力,才能切实的为用户提供各类服务。
1.3.2数据管理技术
云计算需要进行大量的数据分析,要及时的完成用户提交的计算任务,所以,云计算在进行数据管理的环节中,应该结合大数据的技术,提高数据管理的能力,而且还应该在庞大的数据中找出用户需要的数据,从而最大限度的满足用户的需求。云计算数据管理中最实用的两个软件分别是Bigtable和Hbase。对于云计算而言,由于哈希算法的实现简单,基于哈希的划分方法是最快的。基于哈希预划分的超块划分算法则位居第二,比拓扑最优的划分方法快50%。
1.3.3虚拟化技术
现在,全球范围内的信息产业都在朝着云计算的方向发展,虚拟化技术为信息产业提供了很多的便利,人们对虚拟化战略也更加的重视。在云计算的大背景下,虚拟化的方案可以实现系统的整合,在服务器、软件等结合的基础上,网络设备的功能更加的完善,可以带给人们虚拟化的服务。在图初始化阶段,我们主要针对slaver节点进行资源优化,此刻master节点的资源消耗很小,R=0。对于slaver节点而言,在该阶段将会读取磁盘中的图数据并将其加载到内存中去,需要大量的memory和10资源。如果需要加载图的大小为M,slaver节点数量为W,则一个节点需要存储的数据规模为M/W。
1.3.4并行编程模式
由于云计算的用户非常多,他们会同时提交大量的数据,云计算的编程模型应该复杂的运算,并且对调度任务执行,充分的利用云计算的资源。现在,云计算一般是运用MapReduce的方式,这个编程的模式可以将复杂的数据简化,为数据的编程提供可行的解决方案,并且具有成本优势,其性能和效果都能得到保障。
2云计算环境下大规模图数据处理技术的
研究
图是一类非线性的数据结构,在应用的环节呈现出多对多的结构关系,图数据中,不同的元素中都有很多个直接前趋和直接后继,与其他形式的数据相比,其表达的含义更加的丰富,而且被广泛应用在各项工程中。图数据的量非常大,所以,在进行大规模的图数据处理的环节中,存在一些技术局限性。在相关的专家和学者的大量研究中,相关的理论如今已经非常的成熟,这为图数据的处理提供了大量的可行的依据。但是,信息化时代在不断的发展,图数据的规模在不断的提升,所以应该完善图数据处理平台。图数据处理
您可能关注的文档
- 中美高职院校学生事务比较研究的启示与思考-中国论文网.docx
- 一种面向车位和反向寻车的智慧停车系统设计.docx
- 以职业生涯规划为载体-加强高职院校学风建设.docx
- 信息技术背景下高中化学趣味课堂的构建.docx
- 第13章电路初探 苏科版物理九年级上册.docx
- 第17课《盼》配套练习(基础+阅读)-部编版六年级上册.docx
- 第15讲 第14课 沟通中外文明的“丝绸之路” 带解析.docx
- 第16讲 第15课 两汉的科技和文化.docx
- 第17课《短文两篇》之《陋室铭》知识点梳理及练习-2022-2023学年七年级语文下册古诗文专题期中期末复习(部编版)教师版.docx
- 第15章 轴对称图形与等腰三角形 综合检测 2023- 2024学年沪科版八年级数学上册.docx
- 第18讲 第17课 西晋的短暂统一和北方各族的内迁.docx
- 第15讲 第14课 沟通中外文明的“丝绸之路”.docx
- 第13课时 中东 欧洲西部.doc
- 第17讲 第16 课三国鼎立.docx
- 第17讲 第16课 三国鼎立 带解析.docx
- 2024_2025年新教材高中历史课时检测9近代西方的法律与教化含解析新人教版选择性必修1.doc
- 2024_2025学年高二数学下学期期末备考试卷文含解析.docx
- 山西版2024高考政治一轮复习第二单元生产劳动与经营第5课时企业与劳动者教案.docx
- 第16讲 第15课 两汉的科技和文化 带解析.docx
- 第13课 宋元时期的科技与中外交通.docx
最近下载
- 单向板肋梁楼盖计算.docx
- 作业4:工学一体化课程《小型网络安装与调试》工学一体化课程考核方案.docx VIP
- 中国画之写意画.ppt VIP
- (2019苏教)小学科学三年级上册:全册整套教案资料.pdf
- 核心素养导向的高中数学课例设计研究与实践(样例)(1).doc
- 驾驶证延期委托书模板.doc
- 作业5:工学一体化课程《小型网络安装与调试》工学一体化课程终结性考核试题.docx VIP
- 作业5:工学一体化课程《小型网络安装与调试》工学一体化课程终结性考核试题.pdf VIP
- 中国画的构图形式ppt课件.pptx
- 作业11:《小型网络安装与调试》工学一体化课程教学进度计划表.pdf VIP
文档评论(0)