利用SOLR搭建企业搜索平台.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
利用SOLR搭建企业搜索平台目录利用SOLR搭建企业搜索平台1运行solr2中文分词3配置文件6MultiCore8solrj10solr查询参数说明15solr使用问题集16solr 实现去掉重复的搜索结果19solr的查询语法24数据库数据导入到solr27中文分词之IK30运行solr在网络上找了很多的关于solr的资料,发现非常的不全面,即使就是官方的wiki,也是如此! 基于现阶段正在研究的solr应用,陆续的会分享我的一些经验! 今天要说的是: 怎么跑起来! 1》 首先下载好solr,我用的是 solr1.3,下载地址: windows版本 /apache-mirror/lucene/solr/1.3.0/apache-solr-1.3.0.zip/apache-mirror/lucene/solr/1.3.0/apache-solr-1.3.0.zip linux版本 /apache-mirror/lucene/solr/1.3.0/apache-solr-1.3.0.tgz/apache-mirror/lucene/solr/1.3.0/apache-solr-1.3.0.tgz 2》准备运行容器,我用的是tomcat6.0.20.如果是玩的话,也可以不用准备专门的容易,你只需解压好solr的下载包,找到 example文件夹,然后运行 start.jar。具体指令:java -jar start.jar做应用的时候,不建议采用该方式。该方式内部包含了jetty! 3》有关tomcat的使用,不是本文的重点,如果你有问题,请参见tomcat的使用。解压好tomcat,将solr包下面的dist文件夹中的apache-solr-1.3.0.war 拷贝到 tomcat的webapps,并且改名为 solr.war。 4》新建一个 solr-tomcat文件夹,我是把这个文件夹建立在C盘根目录,你可以采用同样方式,也可以不这样,放哪由你决定。建立好该文件夹以后,在把它下面在建立一个solr文件夹,把solr包里面的examplesolr文件夹下面的所有文件放入到 solr里面。 5》最后一步 配置 solr.home,可以有三种方式。 1)基于当前路径的方式 这种情况需要在c:solr-tomcat目录下去启动tomcat,Solr查找./solr,因此在启动时候需要切换到c:solr-tomcat 2)基于环境变量 windows在环境变量中建立solr.home,值为c:solr-tomcat linux在当前用户的环境变量中(.bash_profile)或在catalina.sh中添加如下环境变量 export JAVA_OPTS=$JAVA_OPTS -Dsolr.solr.home=/opt/solr-tomcat/solr 3)基于JNDI 在tomcat的conf文件夹建立Catalina文件夹,然后在Catalina文件夹中在建立localhost文件夹,在该文件夹下面建立solr.xml,其中内容: Xml代码   123Context docBase=c:tomcatwebappssolr.war debug=0 crossContext=true   E=solr/home type=java.lang.String value=c:/solr-tomcat/solr override=true / /Context 问题描述: 个人发现的一个问题,就是如果配置好JNDI的话,然后在tomcat的bin文件夹下面启动 tomcat的话,会在tomcat的bin下面建立solr文件夹,这个文件夹中主要存放的索引文件。本来这些东西应该放入c:solr-tomcatsolr。如果你不想出现这种情况的话,请使用基于当前路径的方式。6》打开浏览器,请看看能否访问该服务。如果能够访问,恭喜您跑起来了。中文分词这篇文章,主要说的是 怎么在solr中加入中文分词,参考了一些文章,但是还是花了不少时间才搞出的。可能是大侠们太牛了,所以很多细节东西都没有写出来!但是要指出的是很多文章都是抄来抄去的! 入正题: 在上面的一个文章中,已经使solr跑起来了,在上面的基础上,加入中文分词。我用的是paoding分词器! 1》请下好paoding分词器,下载地址: /p/paoding/downloads/list/p/paoding/downloads/list,在这里要非常感谢paoding作者:qieqie 在使用paoding的时候要注意:paoding的dic位置,也就是字典的位置,有两种办法解决: 1) 在系统环境变量中加入PAODING_DIC_HOME这个变量,值为paoding压缩包下面的dic的解压位

文档评论(0)

小教资源库 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档