- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
Elasticsearch面试题及详细答案
一、基础概念类
问题:什么是Elasticsearch?它的核心应用场景有哪些?
答案:Elasticsearch(简称ES)是一个基于Lucene构建的分布式、高扩展、高实时的全文搜索引擎。它不仅能做全文检索,还能实现结构化数据搜索、数据分析(比如日志分析、指标统计)等功能,核心优势是分布式架构带来的高可用、高并发处理能力,以及近实时的搜索响应速度。
常见应用场景:①日志/监控数据分析(比如ELK栈);②电商平台的商品搜索(支持关键词匹配、过滤、排序);③企业内部的文档检索系统;④实时指标监控(比如系统性能指标、用户行为指标统计);⑤地理位置搜索(比如附近的商家、景点)。
问题:Elasticsearch中的核心概念(索引、文档、分片、副本)分别是什么?
索引(Index):相当于关系型数据库中的“数据库”,是一组具有相似结构的文档的集合。比如电商平台中,“商品索引”就存储所有商品相关的文档。索引名必须小写,不能包含特殊字符。
文档(Document):是ES中最小的数据单元,相当于关系型数据库中的“行”。文档是JSON格式的,每个文档都有一个唯一的ID(可以手动指定,也可以由ES自动生成),并且属于某个索引。
分片(Shard):由于ES是分布式系统,索引的数据会被拆分到多个分片上存储,每个分片都是一个独立的Lucene实例(可以理解为一个小型的搜索引擎)。分片的作用是实现水平扩展,解决单节点存储和性能瓶颈——数据量太大时,增加分片数量就能分散压力。分片分为主分片(PrimaryShard)和副本分片(ReplicaShard)。
副本(Replica):是主分片的备份,主要作用有两个:①提高可用性:当主分片所在节点故障时,副本可以升级为主分片,保证服务不中断;②提升查询性能:查询请求可以分发到多个副本上并行处理,提高吞吐量。注意:副本不能和对应的主分片存储在同一个节点上(否则节点故障时主副都丢失)。
问题:Elasticsearch和关系型数据库(比如MySQL)的核心概念对应关系是什么?
答案:核心对应关系如下:
ES索引(Index)?MySQL数据库(Database)
ES类型(Type,7.x及以上已废弃)?MySQL表(Table)
ES文档(Document)?MySQL行(Row)
ES字段(Field)?MySQL列(Column)
ES映射(Mapping)?MySQL表结构(Schema)
注意:7.x之后ES移除了Type,原因是不同Type下的文档如果有同名字段,可能会导致字段类型冲突(比如一个Type中字段是字符串,另一个是数字),不利于分片存储和查询效率。现在推荐一个索引只存储一类文档。
二、核心原理类
问题:Elasticsearch的倒排索引原理是什么?为什么它比传统的正排索引查询更快?
先明确两个概念:正排索引(ForwardIndex)和倒排索引(InvertedIndex)。
正排索引:以文档ID为key,存储文档中所有字段的内容。比如查询“包含关键词‘手机’的文档”,需要遍历所有文档,逐个判断是否包含该关键词——效率极低,尤其是数据量大的时候。
倒排索引:核心是“先分词,再建立词到文档的映射”,相当于以“关键词”为key,存储包含该关键词的所有文档ID及相关信息(比如词在文档中的位置、出现频率)。
倒排索引的核心组成:
①词典(Dictionary):存储所有去重后的关键词(分词后的结果),相当于“关键词字典”。
②倒排表(PostingList):每个关键词对应的文档列表,包含文档ID、词频(TF)、逆文档频率(IDF)等信息(这些信息用于后续的相关性排序)。
为什么更快?:查询时,先从词典中快速定位到关键词,再通过倒排表直接获取所有包含该关键词的文档,无需遍历所有文档。比如查询“手机”,直接找到“手机”对应的倒排表,就能拿到所有相关文档——这是ES全文检索高效的核心原因。
问题:Elasticsearch的分片分配策略是什么?主分片和副本分片的分配规则?
核心原则:分片分配由ES的集群协调器(Master节点)负责,目标是保证集群平衡(数据均匀分布)、高可用(主副分片不共节点)、性能最优(查询压力分散)。
主分片分配规则:
您可能关注的文档
最近下载
- 2025版《举一反三》章节综合测试卷第八章 直线和圆、圆锥曲线综合测试卷(含答案及解析).pdf VIP
- 2022预应力混凝土空心板应用技术规程.docx VIP
- 2025年农产品质量安全技能大赛考试题库资料(含答案).docx VIP
- 七年级上册语文读读写写注音及解释(1).pdf VIP
- 内蒙古自治区2021-2022学年普通高学校业水平考试(高二会考)英语真题和答案详解.pdf VIP
- 最新初中生物新课标《义务教育生物学课程标准(2022-年版)》学习解读PPT课件.pptx VIP
- 中考英语考试真题及详细参考答案【完整2份】人教版.pdf VIP
- 新教材 高中英语外研版必修第一册全册各单元英语作文写作指导.pdf VIP
- 妇产科护理质量改进分析.pptx VIP
- 股票大作手--操盘术.pdf VIP
原创力文档


文档评论(0)