搜索引擎揭秘(讲座) [猎兔Eric]概述.ppt

  1. 1、本文档共44页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Schema.xml field name=id type=string indexed=true stored=true multiValued=false / field name=title type=text_ws indexed=true stored=true multiValued=false / field name=body type=text_ws indexed=true stored=true multiValued=false / Schema.xml 指定id为唯一列 uniqueKeyid/uniqueKey 指定body为默认搜索列。 defaultSearchFieldbody/defaultSearchField solrconfig.xml 用来配置solr运行的系统参数,例如缓存,插件等。 预热搜索数量最好少于CPU核数量 maxWarmingSearchers4/maxWarmingSearchers 增加数据 HTTP POST to http://localhost:8983/solr/update/ add doc field name=employeeId05991/field field name=officeBridgewater/field field name=skillsPerl/field field name=skillsJava/field /doc [doc ... /doc[doc ... /doc]] /add 更新/删除数据 更新 若增加文档的主键已经存在索引库中,则替换已有的。 删除 通过主键删除 deleteid05991/id/delete 通过查询删除 delete queryname:Anthony/query /delete Commit/ Optimize/ Solr的后台管理界面 Solr后台查询实例 查询(Query),根据查询条件可以得到查询结果,例如*:* 查询条件 查询结果数 查询用时 Search 基本参数 qt – 查询类型 (request handler),例如 standard wt – 返回格式类型(response writer),例如xml或json 公共参数 q – 查询词 sort – 排序方式 start - 返回结果的开始行 rows -本次需要返回结果的行数 fl – 需要返回的列名称 Faceted Search http://localhost:8983/solr/select?q=ipodrows=0facet=truefacet.limit=-1facet.field=catfacet.mincount=1facet.field=inStock response responseHeader status0/status QTime3/QTime /responseHeader result numFound=4 start=0/ lst name=facet_counts lst name=facet_queries/ lst name=facet_fields lst name=cat int name=music1/int int name=connector2/int int name=electronics3/int /lst lst name=inStock int name=false3/int int name=true1/int /lst /lst /lst /response 搜索界面 检索案例 / (前端.net) / (前端PHP) 商业支持 Lucene Solr 谢谢! 搜索引擎解密 猎兔搜索 罗刚 搜索引擎结构 文档 文本提取 索引程序 索引库(Lucene) 搜索查询服务器(Solr) 文件 数据库 爬虫 NBA 搜索 Lucene是什么 包括 全文索引库 简单的语言解析功能 不包括 爬虫 文档格式解析 “PageRank”等排序算法 Lucene来源与发展 1999 Cutting 开发的第一个Java程序 2001 捐赠给Apache 2004年11月 1.4.3版本 2008年10月 2.4.0版本 2009年11月 3.0.0版本 Lucene的用户 国际 Twitter IBM LinkedIn 捐出分类统计的子项目bobo-browse和 实时搜索的项目Zoie 国内 凤凰网 敦煌网 豆丁 人工编的名词索引-方便查找 全文索引结构 1 2 4 3 5 词: 文档: 北京

文档评论(0)

187****5045 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档