- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于SparkSQL的分布式全文检索框架的设计与实现-计算机科学
第 卷 第 期 计 算 机 科 学
45 9 Vol.45No.9
年 月
2018 9 COMPUTER SCIENCE Se.2018
p
基于SarkSL的分布式全文检索框架的设计与实现
p Q
,
12 2 2 2 2
崔光范 许利杰 刘 杰 叶 丹 钟 华
1 2
(中国科学院大学 北京 ) (中国科学院软件研究所 北京 )
100049 100049
, , .
摘 要 随着信息化的深入 大数据在各个领域产生了巨大的价值 海量数据的存储和快速分析成为新的挑战 传统
、 , .
的关系型数据库由于性能 扩展性的不足以及价格昂贵等方面的缺点 难以满足大数据的存储和分析需求 Sark
p
, ,
SQL是基于大数据处理框架Sark的数据分析工具 目前已支持 TPCGDS基准 成为大数据背景下传统数据仓库的替
p
. , ,
代解决方案 全文检索作为一种文本搜索的有效方式 能够与一般的查询操作结合使用 提供更加丰富的查询和分析
. , , . ,
操作 目前 SarkSQL仅支持简单的查询操作 不支持全文检索 为了满足传统业务迁移和现有业务的使用需求
p
, 、 、 、 ,
提出了分布式全文检索框架 涵盖了 文法 翻译转换框架 全文检索并行化 检索优化 个模块 并在
SQL SQL 4 Sark
p
. , , 、
SQL上进行了实现 实验结果表明相比于传统的数据库 在两种检索优化策略下 该框架的索引
您可能关注的文档
- 口述历史与历史教学.PDF
- 口述历史与客家侨批的文化传承.PDF
- 口述历史记忆的建构与发展-重庆文理学院学报编辑部.PDF
- 口述历史项目手册-EvergreenEducationOrganization.PDF
- 古今西文图书资讯的查找.PPT
- 古代散文理论中文气说的风格美指向-武汉大学人文社会科学学报.PDF
- 古文献手写汉字切分方法研究-郑州大学学报工学版.PDF
- 古诗文及必修4落笔惊风雨-宁波基础教学研究网.PPT
- 古筝曲云裳诉.DOC
- 古诗文背诵默写-皖西中学.PPT
- 基于二阶XNN的中医诊断古文词性标注-计算机工程.PDF
- 基于产业吸引力评价的上海知识服务外包产业发展对策研究.PDF
- 基于人性本真性的拟人化广告的负面情绪与态度——愧疚感-心理学报.PDF
- 基于信任建立的工程项目内耗效应治理机制.PDF
- 基于企业需求的中职办公软件实训教学研究课题辅助材料.PDF
- 基于信息科技学案教学的高一学生自主学习能力培养模式研究.DOC
- 基于信息化技术的水利现代化思路研究-水资源开发与管理.PDF
- 基于光程编码与相干合成的三维超分辨术鄢-物理学报.PDF
- 基于分位数回归的技能偏向性技术进步对工资影响研究-东北大学.PDF
- 基于城绿地系统规划背景视角下的湿地公园规划设计——以云南.DOC
文档评论(0)