- 7
- 0
- 约2.88万字
- 约 5页
- 2019-08-18 发布于天津
- 举报
基于Hadoop的RDF数据存储及查询优化-计算机应用研究.PDF
ppcaon esearco ompuers e.
基于Hadoop的RDF数据存储及查询优化
徐德智,刘 扬,SarfrazAhmed
(中南大学信息科学与工程学院,长沙410083)
摘 要:随着资源描述框架(resourcedescriptionframework,RDF)数据量的快速增长,利用分布式的方法来存储
和管理大规模RDF数据成为当前的研究热点。为了实现对海量RDF数据的高效存储和查询,研究了RDF三元
组在分布式平台Hadoop中的存储和查询方法,提出了一种新的基于Hadoop的RDF数据处理优化方法,通过采
用基于HBase混合式数据布局方法以及引入MapReduce连接查询的I/O代价模型来对海量RDF数据的查询进
行优化。在LUBM标准测试数据集中进行了实验,结果表明该方法能够在保证空间效率的前提下,有效地提高
复杂查询的效率。
关键词:资源描述框架;RDF数据查询;MapReduce;HBase;查询优化
原创力文档

文档评论(0)