大规模RDF图数据的正则路径查询-研究.pdf

大规模RDF图数据的正则路径查询-研究.pdf

第一章 绪论 据集bioinformatics[9]等。截至2012 年9 月,Linked Data 已经包含了295 个数据 集,316 亿条三元组以及5.04 亿个RDF 链接,我们已经进入了大数据[10]时代。 如此大规模的语义数据为传统的数据存储带来了新的挑战。传统数据库以表 的形式维护数据,并要求数据的强一致性,在数据查询过程中涉及大量的表之间 的连接操作。这种特性,用来管理图数据,尤其是类似Linked Data 中发布的大 规模图数据会存在性能瓶颈。首先,当数据规模无限增大,例如,图的节点和边 数目增大到一定量,则关系数据库表维护代价尤其是表之间做连接操作代价过 高。其次,维护如此大规模数据的强一致性会产生很多关于性能方面的问题,例 如事务管理代价等。此外,表结构不易于扩展,并不适用于现今较为广泛应用的 是水平扩展(scale-out)形式的集群服务器。 NoSQL[37](Not Only SQL)是不同于传统关系型数据库和数据管理系统的新 一类存储库,其主要特点包括:可扩展性强,通常为分布式形态;NoSQL 存储 库不需要 SQL 作为其查询语言;数据存储不需要固定

文档评论(0)

1亿VIP精品文档

相关文档