- 1、本文档共40页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
企业级搜索引擎Solr使用入门指南
企业级搜索引擎Solr使用入门指南??? 由于搜索引擎功能在门户社区中对提高用户体验有着重在门户社区中涉及大量需要搜索引擎的功能需求,目前在实现搜索引擎的方案上有集中方案可供选择:基于Lucene自己进行封装实现站内搜索。工作量及扩展性都较大,不采用。调用Google、Baidu的API实现站内搜索同第三方搜索引擎绑定太死,无法满足后期业务扩展需要,暂时不采用。基于Compass+Lucene实现站内搜索??? 适合于对数据库驱动的应用数据进行索引,尤其是替代传统的like ‘%expression%’来实现对varchar或clob等字段的索引,对于实现站内搜索是一种值得采纳的方案。但在分布式处理、接口封装上尚需要自己进行一定程度的封装,暂时不采用。基于Solr实现站内搜索封装及扩展性较好,提供了较为完备的解决方案,因此在门户社区中采用此方案,后期加入Compass方案。1、 Solr简介??? Solr是一个基于Lucene的Java搜索引擎服务器。Solr 提供了层面搜索、命中醒目显示并且支持多种输出格式(包括 XML/XSLT 和 JSON 格式)。它易于安装和配置,而且附带了一个基于 HTTP 的管理界面。Solr已经在众多大型的网站中使用,较为成熟和稳定。Solr 包装并扩展了 Lucene,所以Solr的基本上沿用了Lucene的相关术语。更重要的是,Solr 创建的索引与 Lucene 搜索引擎库完全兼容。通过对 Solr 进行适当的配置,某些情况下可能需要进行编码,Solr 可以阅读和使用构建到其他 Lucene 应用程序中的索引。此外,很多 Lucene 工具(如Nutch、 Luke)也可以使用 Solr 创建的索引。2、 Tomcat下Solr安装配置??? 由于Solr基于java开发,因此Solr在windows及Linux都能较好部署使用,但由于Solr提供了一些用于测试及管理、维护较为方便的shell脚本,因此在生产部署时候建议安装在Linux上,测试时候可以在windows使用。下面以Linux下安装配置Solr进行说明,windows与此类似。wget /tomcat/tomcat-6/v6.0.16/bin/apache-tomcat-6.0.16.zipunzip apache-tomcat-6.0.16.zip mv apache-tomcat-6.0.16 /opt/tomcat chmod 755 /opt/tomcat/bin/* wget /lucene/solr/1.2/apache-solr-1.2.0.tgztar zxvf apache-solr-1.2.0.tgz Solr的安装配置最为麻烦的是对solr.solr.home的理解和配置,主要有三种基于当前路径的方式cp apache-solr-1.2.0/dist/apache-solr-1.2.0.war /opt/tomcat/webapps/solr.war mkdir /opt/solr-tomcat cp -r apache-solr-1.2.0/example/solr/ /opt/solr-tomcat/ cd /opt/solr-tomcat /opt/tomcat/bin/startup.sh 由于在此种情况下(没有设定solr.solr.home环境变量或JNDI的情况下),Solr查找./solr,因此在启动时候需要切换到/opt/solr-tomcat 基于环境变量solr.solr.home在当前用户的环境变量中(.bash_profile)或在/opt/tomcat/catalina.sh中添加如下环境变量export JAVA_OPTS=$JAVA_OPTS -Dsolr.solr.home=/opt/solr-tomcat/solr 基于JNDI配置mkdir –p /opt/tomcat/conf/Catalina/localhost touch /opt/tomcat/conf/Catalina/localhost/solr.xml ,内容如下:????? Context docBase=/opt/tomcat/webapps/solr.war debug=0 crossContext=true ???????????????? Environment name=solr/home type=java.lang.String value=/opt/solr-tomcat/solr override=true /??? /Context访问solr管理界面http://ip:port/solr3、 Solr原理??? Solr对外提供标准的http接口来实现对数据的索引的增加、删除、
文档评论(0)