基于SparkSQL的分布式全文检索框架的设计与实现-计算机科学.PDF

基于SparkSQL的分布式全文检索框架的设计与实现-计算机科学.PDF

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于SparkSQL的分布式全文检索框架的设计与实现-计算机科学

第 卷 第 期 计 算 机 科 学 45   9 Vol.45No.9 年 月 2018 9 COMPUTER SCIENCE Se.2018 p 基于SarkSL的分布式全文检索框架的设计与实现 p Q , 12 2 2 2 2 崔光范 许利杰 刘 杰 叶 丹 钟 华               1 2 (中国科学院大学 北京 ) (中国科学院软件研究所 北京 )   100049     100049   , , . 摘 要 随着信息化的深入 大数据在各个领域产生了巨大的价值 海量数据的存储和快速分析成为新的挑战 传统     、 , . 的关系型数据库由于性能 扩展性的不足以及价格昂贵等方面的缺点 难以满足大数据的存储和分析需求 Sark p , , SQL是基于大数据处理框架Sark的数据分析工具 目前已支持 TPCGDS基准 成为大数据背景下传统数据仓库的替 p . , , 代解决方案 全文检索作为一种文本搜索的有效方式 能够与一般的查询操作结合使用 提供更加丰富的查询和分析 . , , . , 操作 目前 SarkSQL仅支持简单的查询操作 不支持全文检索 为了满足传统业务迁移和现有业务的使用需求 p , 、 、 、 , 提出了分布式全文检索框架 涵盖了 文法 翻译转换框架 全文检索并行化 检索优化 个模块 并在 SQL SQL 4 Sark p . , , 、 SQL上进行了实现 实验结果表明相比于传统的数据库 在两种检索优化策略下 该框架的索引

文档评论(0)

fengruiling + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档