Lucene_索引数据库.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Lucene 索引数据库(转载) 关键词: Lucene ?? 索引数据库 ?? ?????????????????????????????????????? ? Lucene,作为一种全文搜索的辅助工具,为我们进行条件搜索,无论是像Google,Baidu之类的搜索引擎,还是论坛中的搜索功能,还 是其它C/S架构的搜索,都带来了极大的便利和比较高的效率。本文主要是利用Lucene对MS Sql Server 2000进行建立索引,然后进行全文索引。至于数据库的内容,可以是网页的内容,还是其它的。本文中数据库的内容是图书馆管理系统中的某个作者表 -Authors表。   因为考虑到篇幅的问题,所以该文不会讲的很详细,也不可能讲的很深。   本文以这样的结构进行:   1.介绍数据库中Authors表的结构   2.为数据库建立索引   3.为数据库建立查询功能   4.在web界面下进行查询并显示结果   1.介绍数据库中Authors表的结构 字段名称???????? 字段类型???????? 字段含义 Au_id??????????????? Varchar(11)??? 作者号 Au_name??????? Varchar(60)???? 作者名 Phone???????????? Char(12)?????????? 电话号码 Address????????? Varchar(40)????? 地址 City?????????????????? Varchar(20)???? 城市 State??????????????? Char(2)???????????? 省份 Zip??????????????????? Char(5)???????????? 邮编 contract??????????? Bit(1)??????????????? 外键(关系不大) 表中的部分内容: ?  2.为数据库建立索引   首先建立一个类TestLucene.java。这个类就是对数据库进行建立索引,编写查询条件等。   当然,最开始就是建立数据库连接。连接代码这里就省略了。^_^   接着,新建一个方法getResutl(String),它返回的是数据库表Authors的内容。具体代码如下: ??? public ResultSet getResult(String sql){ ????? try{ ??????? Statement stmt = conn.createStatement(); ??????? ResultSet rs = stmt.executeQuery(sql); ??????? return rs; ????? } ????? catch(SQLException e){ ??????? System.out.println(e); ????? } ????? return null; ??? }   然后,为数据库建立索引。   首先要定义一个IndexWriter(),它是将索引写进Lucene自己的数据库中,它存放的位置是有你自己定义的。在定义 IndexWriter是需要指定它的分析器。Lucene自己自带有几个分析器,例 如:StandarAnalyzer(),SimpleAnalyzer(),StopAnalyzer()等。它作用是对文本进行分析,判断如何进行切 词。 接着,要定义一个Document。Document相当于二维表中一行数据一样。Document里包含的是Field字段,Field相当于数据库中一列,也就是一个属性,一个字段。 最后应该对IndexWriter进行优化,方法很简单,就是writer.optimize(). 具体代码如下: ? public void Index(ResultSet rs){ ????? try{ ??????? IndexWriter writer = new IndexWriter(d:/index/, getAnalyzer(), true); ??????? while(rs.next()){ ??????????? Document doc=new Document(); ??????????? doc.add(Field.Keyword(id,rs.getString(au_id))); ??????????? doc.add(Field.Text(name,rs.getString(au_name))); ??????????? doc.add(Field.UnIndexed(address,rs.getString(address))); ??????????? doc.add(Field.UnIndexed(phone,rs.g

文档评论(0)

***** + 关注
实名认证
文档贡献者

本账号下所有文档分享可拿50%收益 欢迎分享

1亿VIP精品文档

相关文档