- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
ElasticSearch 索引设置总结
?index.refresh_interval?
? ? ? 配置一个刷新时间,将index buffer刷新到os cache的时间间隔,刷新到os cache的数据才可以被索引到,默认是1s.假如对实时性搜索要求不高的地方,可设置时间为30s,提高功能。
number_of_replicas
? ? ? ?对于集群数据节点 =2 的场景,建议副本至少设置为 1(一主一从,共两个副本), 可以提高集群容错和搜索吞吐量(副本分片可用于查询)。
index.number_of_shards
? ? ?主副本的分片数,默认是5个,最大值限制为1024个,这个值是分片数可适当的添加,提高索引的并发功能,但是分片越多,也会导致资源耗费越高,索引要依据访问并发数和ES集群的资源来设置。阅历公式:分片数 = 索引大小/分片大小阅历值 30GB,官方推举Shard值在 20-40GB功能最好,日志类:单分片50GB;搜索类:单分片20GB。不足100G,可直接设置3-5个分片(结合节点数和扩展性),超过100G则可以依据如上阅历公式来规划。
index.max_result_window
? ? 索引能够查询到最大数据量,from+size深分页的最大条数,默认是10000,适当限制这个值可以防止深分页内存占用过多,假如全量导出,需要使用Scroll游标方法。
index.store.preload
? ? ?默认情况下,Elasticsearch完全依靠操作系统文件系统缓存来缓存I / O操作.可以设置index.store.preload,以告知操作系统在打开时将热索引文件的内容加载到内存中。默认值为空,即不提前加载索引到内存中,常见的值有[nvd, dvd, tim, doc, dim]。对应的norms, doc values, terms dictionaries, postings lists, points,常见的设置为?index.store.preload =?[nvd, dvd],即提前加载norms评分信息和doc value数据到内存,便于快速索引。
index.sort.field??和?index.sort.order
? ? ? 建立索引的排序字段,写入的时候就依据挨次写入。对于一些具备挨次的字段,可以提前设置,比如时间字段。配置见下
{
settings : {
index : {
sort.field : date, // 字段名字
sort.order : desc // 升序 asc 和降序 desc
}
}
}
Mapping设置
?动态映射
?mapping的通用配置,dynamic_templates配置动态类型转换,将一个类型转换为另一个类型
{
mappings: {
_doc: {
dynamic_templates: [
{
strings_as_keywords: {
match_mapping_type: string,
mapping: {
type: keyword
}
}
}
],
_source: {
enabled: true
},
properties: {
.....
}
}
}
}
?字段类型??
? ? 官方文档:https://www.elastic.co/guide/en/elasticsearch/reference/6.8/mapping.html#_field_datatypes
? ? ?a simple type like?text,?keyword,?date,?long,?double,?boolean?or?ip.
? ? ?a type which supports the hierarchical nature of JSON such as?object?or?nested.
? ? or a specialised type like?geo_point,?geo_shape, or?completion.
?常见的类型和搜索类型的联系
? ??(1)text 类型作用:分词,将大段的文字依据分词器切分成独立的词或者词组,以便全文检索。? ? ? ?适用于:email 内容、某产品的描述等需要分词全文检
您可能关注的文档
- Alibaba Sentinel 限流、熔断实现详解.docx
- +倍性能提升全过程优酷账号绑定淘宝账号的TPS从到的优化历程.docx
- Antd 代码彩蛋炸翻一圈人.docx
- Apache Kafka . 发布,离彻底去掉 ZooKeeper 更进一步.docx
- Apache Kafka服务端设计理念.docx
- Apache Kafka:优化部署的 种最佳实践.docx
- Apache Pulsar 对现代数据堆栈至关重要的几个原因.docx
- Arrow更好用的python时间序列处理库,你用过吗?.docx
- Aviator 表达式求值引擎开源框架.docx
- Arthas 实践——生产环境排查 CPU 飚高问题.docx
文档评论(0)