搜索引擎解密.pptVIP

  • 0
  • 0
  • 约7.73千字
  • 约 44页
  • 2017-03-03 发布于湖北
  • 举报
Schema.xml field name=id type=string indexed=true stored=true multiValued=false / field name=title type=text_ws indexed=true stored=true multiValued=false / field name=body type=text_ws indexed=true stored=true multiValued=false / Schema.xml 指定id为唯一列 uniqueKeyid/uniqueKey 指定body为默认搜索列。 defaultSearchFieldbody/defaultSearchField solrconfig.xml 用来配置solr运行的系统参数,例如缓存,插件等。 预热搜索数量最好少于CPU核数量 maxWarmingSearchers4/maxWarmingSearchers 增加数据 HTTP POST to http://localhost:8983/solr/update/ add doc field name=employeeId05991/field field name=officeBridgewater/field field name=skillsPerl/field field name=skillsJava/field /doc [doc ... /doc[doc ... /doc]] /add 更新/删除数据 更新 若增加文档的主键已经存在索引库中,则替换已有的。 删除 通过主键删除 deleteid05991/id/delete 通过查询删除 delete queryname:Anthony/query /delete Commit/ Optimize/ Solr的后台管理界面 Solr后台查询实例 查询(Query),根据查询条件可以得到查询结果,例如*:* 查询条件 查询结果数 查询用时 Search 基本参数 qt – 查询类型 (request handler),例如 standard wt – 返回格式类型(response writer),例如xml或json 公共参数 q – 查询词 sort – 排序方式 start - 返回结果的开始行 rows -本次需要返回结果的行数 fl – 需要返回的列名称 Faceted Search http://localhost:8983/solr/select?q=ipodrows=0facet=truefacet.limit=-1facet.field=catfacet.mincount=1facet.field=inStock response responseHeader status0/status QTime3/QTime /responseHeader result numFound=4 start=0/ lst name=facet_counts lst name=facet_queries/ lst name=facet_fields lst name=cat int name=music1/int int name=connector2/int int name=electronics3/int /lst lst name=inStock int name=false3/int int name=true1/int /lst /lst /lst /response 搜索界面 检索案例 / (前端.net) / (前端PHP) 商业支持 Lucene Solr 谢谢! 搜索引擎解密 猎兔搜索 罗刚 搜索引擎结构 文档 文本提取 索引程序 索引库(Lucene) 搜索查询服务器(Solr) 文件 数据库 爬虫 NBA 搜索 Lucene是什么 包括 全文索引库 简单的语言解析功能 不包括 爬虫 文档格式解析 “PageRank”等排序算法 Lucene来源与发展 1999 Cutting 开发的第一个Java程序 2001 捐赠给Apache 2004年11月 1.4.3版本 2008年10月 2.4.0版本 2009年11月 3.0.0版本 Lucene的用户 国际 Twitter IBM LinkedIn 捐出分类统计的子项目bobo-browse和 实时搜索的项目Zoie 国内 凤凰网 敦煌网 豆丁 人工编的名词索引-方便查找 全文索引结构 1 2 4 3 5 词: 文档: 北京

文档评论(0)

1亿VIP精品文档

相关文档