lucene_standard精要
day01 Lucene入门
Lucene第一天的课程内容:
任务:掌握原理、熟悉Lucene的API
搜索引擎的发展史
Lucene入门
Lucene的API详解
索引调优
Lucene搜索结果排名规则
搜索引擎的发展史
搜索引擎的发展史
萌芽:Archie、Gopher
起步:Robot(网络机器人)和spider(网络爬虫)
Robot:网络机器人,自动在网络中运行,完成特定任务的程序,如刷票器、抢票软件等。
spider:网络爬虫,是一中特殊的机器人,抓取(下载)并分析网络资源,包括网页里面的超链接、图片、数据库、音频、视频等资源信息。
发展:excite、galaxy、yahoo
繁荣:infoseek、altavista、Google、百度
搜索引擎的原理
信息检索过程
构建文本库
建立索引
进行搜索
对结果进行排序
原理
搜索引擎的工作原理,通过用户输入的信息,通过网络爬虫即搜索服务器,将各与之相关的网站信息抓取并存放到自己的数据服务器中,在存入数据服务器的过???中将这些数据信息需要创建索引库,用户查询的结果信息都是来源与索引库信息,如果点击该结果超链接则访问的是该网站信息,如果选择“快照”则访问的是缓存信息。
那为什么要建立索引库呢?建立索引库的过程就是将该结果建立索引,通俗一点的理解就是建立目录的过程。
搜索引擎的使用场景
使用场景
电商网站的搜索,如京东、天猫
您可能关注的文档
- 任务驱动型.doc
- 任务驱动型作文范文.doc
- 任务驱动型写作与传统材料作文的比较.ppt
- 任务十--漆面研磨抛光.ppt
- 任务单开具、审核、确认中注意事项.ppt
- 任课教师如何配合好班主任的工作.doc
- 任正非给员工讲的18个故事.doc
- 仿写题的解题要诀.doc
- LTE语音相关知识介绍.docx
- 仿制药生物等效性试验指导原则(日本).doc
- 2025年下半年小学教师资格考试简答题汇总.pdf
- 护理教学比赛资源整合.pptx
- 2022泰和安消防 JTGB-HM-TX3H01 JTGB-HM-TX3H02 TGB-HM-TX3H03 系列点型红外火焰探测器.docx
- 2025年驾驶证资格考试最新最全交通标志大全.pdf
- 护理教学理念:更新与发展.pptx
- 2025年新驾考科目一巧记速记口诀(全国通用).pdf
- 2025年一级建造师《项目管理》黄金预测考点【打印版】.pdf
- 证券公司高级管理人员资质测试章节练习-第一部分综合类第六章至七章:证券投资基金法、信托法.pdf
- 护理教学研究:方法与成果.pptx
- 麻纺车间设备更新准则.docx
最近下载
- 农业知识发现考试题库及答案.doc VIP
- 相关与回归分析 .ppt VIP
- 网络安全等级测评师能力评估(中级)第一套样卷测试题及答案.docx VIP
- 2025年农业知识考试题库及答案.doc VIP
- 最新农业知识考试题库.doc VIP
- 【129页】数字孪生城市生命线安全运行监测系统平台规划设计方案.docx
- 2024年7月黑龙江高中学业水平合格考生物试卷真题(含答案详解).pdf VIP
- 肺结节诊治中国专家共识(2024年版).pptx VIP
- 2025年职业资格碳排放管理员碳排放核算员-碳排放核算员参考题库含答案解析.docx VIP
- 高考数学十年(2016-2025)真题《圆锥曲线(椭圆、双曲线)》专项分类汇编含答案.docx VIP
原创力文档

文档评论(0)