- 1、本文档共33页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
elasticsearch课案
功能概念 、系统原理 、系统的使用
演讲人:林健
概念解释
1
ElastichSearch(ES) 以及组成
第一章 概念解释 – 1.1
第一章 概念解释 – 1.2
第一章 概念解释 – 1.3
第一章 概念解释 – 1.4
1 N
第一章 概念解释 – 1.5
分片( primary_shards)
复制分片 ( primary_shards)
索引文件
(sgment)
复制分片 ( primary_shards)
实时分析
Es可以根据业务要求 ,发挥分布式的优点,尽最大性能实时分析、解析出业务需要的数据文档。
分布集群
实时存储
Elastic 某个主结点保存数据时候,只有当复制分片保存成功,才能认为是实时保存成功。并可以并发支持批量数据保存。文档以分片的形式,保存在不同的机器上。
快速搜索
Elastic并发从N台机器中的复制节点或主节点取出数据,通过查询负载机来进行组合数据,最终响应请求。10亿的数据,可以最快1-2秒内搜索出结果
根据业务需求及当前的搜索量,Elastic可以横向扩展,支持最大PB级的分布数据,可以提高索引的搜索速度。
第一章 概念解释 – 1.6
第一章 概念解释 – 1.6
系统原理
2
ElastichSearch(ES) 查询为什么能实时?
第二章 系统原理 – 2.1
集群中有很多结点,结点与结点之间可以进行配置。
比如:
Node1主结点,非数据结点。
(协调创建索引、查询请求)
Node2非主结点,数据结点。
Node3非主结点,非数据(负载 均衡,组装返回的数据给客户端。)
第二章 系统原理 – 2.2
搜索: 一当一个客户端请求查询某条数据时,通常用如下几个步骤完成搜索。
1)客户端给NODE1发请求,查询名字叫张三的数据。
2)P1节点接收到请求,判断出当前数据_ID对应的分片0,且分片P1中的数据对应的复制分片R0,R1f都有,会将请求转发到R0处理。
3)取出文档数据返回给P1,最终返回给客户端。
注意,这里的请求,其实会并发查询所有复制分片 中的名字叫张三的数据。所以这里会非常快的返回数据。
第二章 系统原理 – 2.3
更新: 一当一个客户端请求更新某条数据时,通常用如下几个步骤完成更新。
1) 客户端给Node1发送更新请求。
2)它转发请求到主分片所在节点Node3。
3)Node3从主分片检索出文档,修改_source字段的JSON,然后在主分片上重建索引。如果有其他进程修改了文档,它以retry_on_conflict设置的次数重复步骤3,都未成功则放弃。
4) 如果 Node3成功更新文档,它同时转发文档的新版本到Node1和Node2上的复制节点以重建索引。当所有复制节点报告成功, Node3返回成功给请求节点,然后返回给客户端。
第二章 系统原理 – 2.4
创建: 一当一个客户端请求创建或更新某条数据时,通常用如下几个步骤完成创建、删除索引 。
1) 客户端给P1发送创建、删除请求。
2)根据 文档ID,将它转发请求到主分片所在节点Node3。
3)Node3在主分片上执行请求,如果成功,它将会转发请求到NODE1和NODE2的复制分片上,当所有复制分片成功,则NODE3返回成功信息给请求结点。在将信息返回给客户端。
第二章 系统原理 – 倒排索引 2.5
倒排索引 : Elasticsearch使用一种叫做倒排索引(inverted index)的结构来做快速的全文搜索。倒排索引由在文档中出现的唯一的单词列表,以及对于每个单词在文档中的位置组成。
例如:“金服集团大数据中心应用开发部”,会被拆成很中文分词在索引表中。
Terms
DOC1
DOC2
金服
X
集团
X
大数据
X
开发部
X
应用
X
X
第二章 系统原理 – 倒排索引 2.6
当我们查询“金服大数据”这一个中文分词时,只需要知道他在哪个文档即可。
Terms
DOC1
DOC2
DOC3
金服
X
X
大数据
X
X
SCORE(相关度)
1
2
1
两个文档都匹配,但是DOC2比其它的有更多的匹配项。相关度评分为【2】,如果我们加入简单的相似度算法(similarityAndlgorithm),计算匹配单词的数目,这样我们就可以说DOC2这个 文档比其它的匹配度更高,这对于我们的查询结果具有更多相关性。也可按照此排序 。
安装部署
3
ElastichSearch(ES) 如何在部署在Linux上
第三章 安装部署 – 3.1 安装
第三章 安装部署 – 3.1 安装
下载与解压:
https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-5.1.1.tar.g
您可能关注的文档
- EEPPR400RC操作手册0512课案.docx
- EF里单个实体的增查改删以及主从表关联数据的各种增删改查课案.docx
- EHcache课案.doc
- EDA课程设计--四人智力竞赛计数抢答器.doc
- 六、1民主政治的摇篮课件.ppt
- 六、推销接近.ppt
- 六、2、我与老师交朋友.ppt
- Eclipse油藏数值模拟应用实例.ppt
- Elasticsearch安装部署.docx
- EDIUS八-文件输出.docx
- 2024年江西省高考政治试卷真题(含答案逐题解析).pdf
- 2025年四川省新高考八省适应性联考模拟演练(二)物理试卷(含答案详解).pdf
- 2025年四川省新高考八省适应性联考模拟演练(二)地理试卷(含答案详解).pdf
- 2024年内蒙通辽市中考化学试卷(含答案逐题解析).docx
- 2024年四川省攀枝花市中考化学试卷真题(含答案详解).docx
- (一模)长春市2025届高三质量监测(一)化学试卷(含答案).pdf
- 2024年安徽省高考政治试卷(含答案逐题解析).pdf
- (一模)长春市2025届高三质量监测(一)生物试卷(含答案).pdf
- 2024年湖南省高考政治试卷真题(含答案逐题解析).docx
- 2024年安徽省高考政治试卷(含答案逐题解析).docx
最近下载
- 闽教版4年级上册英语全册教学课件.pptx
- 浅谈当前我国建筑企业人力资源管理论文.docx VIP
- 浅谈建筑企业人力资源管理论文.docx VIP
- 广东省惠州市高2024届高三上学期第三次调研考试数学试题.pdf
- 病毒性肺炎影像.pptx VIP
- 新教材牛津译林版选择性必修第二册Unit1 The mass media 教学设计.pdf VIP
- (完整版)职业卫生培训试题含答案.pdf
- 初一第一学期第一次家长会课件.ppt VIP
- 惠州市2024届高三第三次调研考试(三调)思想政治试卷(含答案).pdf
- 2024-2025学年上海交通大学附属中高三上学期阶段测试3英语试卷含详解.pdf VIP
文档评论(0)