- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
把 Lucene 索引数据存到数据库表中
2015/1/28 把 Lucene 索引数据存到数据库表中 | 隔叶黄莺 Unmi Blog - 软件编程实践
一般我们都是把 Lucene 索引存放在文件系统中,大数据量时会考虑用分布式文件系统,如 Hadoop 及 MapReduce、GFS 的
应用。也许你会想我们有数据库作为集中的数据存储地,是否可以把 Lucene 索引文件存储到关系型数据库中。可以这么做,
不过好像性能上有些问题,本文就此也作这样一个尝试。
看 /lucene-java/LuceneFAQ
Can I store the Lucene index in a relational database?
Lucene does not support that functionality out of the box, but several people have implemented JdbcDirectory s. The
reports we have seen so far indicate that performance with such implementations is not great, but it is doable.
Lucene 里内置了 FSDirectory、MMapDirectory、RAMDirectory 这样的与索引存储相关的实现。如果要存储到数据库
中,必须实现一个 DbDirectory,对于 Java 也就是 JdbcDirectory 。但事情远没有这么简单,还需要一堆的类来为
JdbcDirectory 服务,如锁机制、缓存机制、内存镜像、不同数据库讲的方言也不一样。
幸好 Compass 实现了把索引存储到数据库的功能,我们可以借用它的代码。先到 / 下载最
新版的 compass-2.2.0-with-dependencies.zip,当前是 2.2.0,所使用的 Lucene 是 2.4.1,有点老了。
所以我们也用 Lucene 2.4.1,用最新的 3.0.2 会有些问题,另外也依赖了compass 的 compass-2.2.0.jar 包。再就是直接使用
compass 为我们写好的 JdbcDirectory 和一批外缘类,需要把 compass-2.2.0-with-dependencies.zip\compass-
2.2.0\src\main\src\org\apache\lucene 目录里的类引进到我们的工程中。
现在就可以开始来写我们的代码了,要演示的例子是索引存储到 MySql 数据库表中,并基于该表里的索引数据进行查询。还
有数据库和表要我们自己预先创建好,比如数据库是 unmi_ db,索引表是 lucene_ index,创建表的 SQL 如下:
1 CREATE TABLE `lucene_index` (
2 `Id` int(11) NOT NULL AUTO_INCREMENT,
3 `name_` varchar(50) DEFAULT NULL,
4 `value_` blob,
5 `size_` decimal(10,2) DEFAULT NULL,
6 `lf_` timestamp NULL DEFAULT NULL,
7 `deleted_` bit(1) DEFAULT NULL,
8 PRIMARY KEY (`Id`)
9 )
请参考这个:Appendix A. Lucene Jdbc Directory
看 Java 代码了:
001 package cc.unmi.lucene;
002
003 import java.io.IOException;
004 import java.sql.Connection;
005
006 import javax.sql.DataSource;
007
008 import org.apache.lucene.analysis.standard.StandardAnalyzer;
009 import org.apache.lucene.document.*;
010 import org.apache.lucene.index.IndexWr
您可能关注的文档
- 工科数学2-5级数(2014.6).doc
- N2阅读中如何寻找作者的主张(网校韩老师).pdf
- NaCl晶体的能带结构.pdf
- 巧用“项”证明数列不等式.pdf
- NACECIP邀请函201008-09上海.pdf
- MRI及1H_MRS对原发性颅内B细胞淋巴瘤的诊断价值_李杰生.pdf
- MM7S预付费电能表小型断路器.pdf
- NC600串口服务器快速安装手册.pdf
- NdFeB导磁材料磁场强度.pdf
- nelson_silencers(消音器).pdf
- 3.1坚持党的领导课件-高中政治统编版必修三政治与法治.pptx
- 2.2 尊重知识产权(课件)高二政治(统编版选择性必修2).pptx
- Unit 5 Where can we see colours 沪教版(2024)英语三年级下册.pptx
- 1.1 质点 参考系 时间 课件 高一上学期物理人教版(2019)必修第一册.pptx
- 5.2硝酸与酸雨防治 课件 年高一下学期化学人教版(2019)必修第二册.pptx
- 1.2 《离骚》课件 统编版高二语文选择性必修下册.pptx
- 5.1.2硫酸和硫酸盐课件 高一下学期化学人教版(2019)必修第二册.pptx
- Unit 4 Healthy food第6课时 人教PEP版(2024)英语三年级下册.pptx
- ABIResearch2023年智能家居物联网设备需要安全的网络架构白皮书英文版13页.pdf
- 谷歌云云计算的未来白皮书53页.pdf
最近下载
- 电能“发、输、变、配、用”五环节简介.pptx VIP
- 先进算力中心建设规划方案.docx VIP
- 安装钳工基础知识全集课件.ppt VIP
- 部编版六年级语文上册第三单元 习作_____让生活更美好 课件(共32张PPT).pptx VIP
- 医疗器械唯一标识管理制度(UDI).docx VIP
- 感术行动专项实施方案.docx VIP
- 企业案例广州超算中心 企业案例广州超算中心、项目建设规划、项目需求分析 1.3项目建设规划.docx VIP
- 音频处理软件:Adobe Audition二次开发_17.社区资源与支持.docx VIP
- 数控铣床第一章 数控铣床概述.ppt VIP
- 偏差报告单【范本模板】.doc VIP
文档评论(0)