- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
lucene构建一个简单的WEB搜索程序,luceneweb项目,luceneweb,lucenejavaweb,lucene搜索,lucene多字段搜索,搜索引擎lucene,lucene模糊搜索,基于lucene的搜索引擎,lucene近实时搜索
Lucene_构建一个简单的WEB搜索程序
lucene 2.3.2 tomcat 6.0.16 je-analysis 1.4.0 lukeall 0.7.1 Mysql jdbc driver 3.1.13 Tidy 04aug2000r7 MyEclipse 6.0M1_E3.3
项目周期
3-4天
目标
Lucene入门
全文检索的概念,倒排索引的概念
建立索引
搜索
中文分词的实现
Nutch入门
串知识点Html,css,javascript,servlet,jsp,mysql,
介绍MVC的概念
演示借用一些javascript的成熟的框架实现页面的特殊效果。例如:rico
学会使用myeclipse
熟悉mysql数据库的用法
什么时候用lucene
数据库大量数据,文本字段内容很多
非结构化文档
安装myeclipse
建立工程(web project
工程名称lucene
如何配置tomcat服务器
好处(自动部署
Window(show view(servers
如何部署web app
Deploy按钮,添加tomcat项目
Web browser窗口
最好不用此browser
Show view(web browser
引入jar包(Lucene工程文件夹下,建立lib目录,拷贝如下jar包到lib目录
lucene-core-2.2.0.jar
Tidy.jar
lucene-2.2.0\lucene-2.2.0\contrib\analyzers(lucene-analyzers-2.2.0.jar
je-analysis-1.4.0.jar
mysql-connector-java-3.1.13-bin.jar
显示line number
Alt/自动完成快捷键效果出不来
.快捷键效果出不来
为一个文件建立索引(英文)
确认已经引入包lucene-core-2.2.0.jar
Field.Store.YES和Field.Store.NO区别
termVector是Lucene 1.4.3新增的它提供一种向量机制来进行模糊查询,很少用。DateTools.timeToString
IndexHTML.java
import java.io.File;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.index.IndexWriter;
public class IndexHTML {
static String index = D:\\share\\05_Servlet_JSP\\tomcat\\apache-tomcat-5.5.17\\index;
static String root = D:\\share\\lucene\\soft\\lucene-2.2.0\\lucene-2.2.0\\docs\\api\\index.html;
public static void main(String args [])throws Exception{
IndexWriter writer = new IndexWriter(index,new StandardAnalyzer(),true);
Document doc = new Document();
File f = new File(root);
doc.add(new Field (path,f.getPath(),Field.Store.YES,Field.Index.UN_TOKENIZED));
doc.add(new Field (content,我们是共产主义接班人,Field.Store.NO,Field.Index.TOKENIZED));
writer.addDocument(doc);
writer.optimize();
writer.close();
}
}
如何确认索引已经正确建立?
java -jar lukeall-0.7.1.jar
tomcat配置
\WEB-INF\lib\
lucene-core-2.2.0.jar
je-analysis-1.4.0.jar
确保8080端口可用
reloadable
C:\tomcat\conf\context.xml(Context reloadable=true
为一个文件建立索引(递归)
import ja
文档评论(0)