话题中间件与数据库 › Elasticsearch

中间件与数据库:Elasticsearch

解决 Elasticsearch cluster_block_exception 错误的终极指南

Elasticsearch 是一个功能强大的分布式搜索引擎,广泛应用于全文检索、实时分析等场景。

尽管如此,像任何复杂系统一样,它也会遇到一些运行问题,其中较为常见且影响较大的就是 cluster_block_exception 错误。

本文将深入解析这种错误的常见原因、如何排查问题以及如何有效解决。

Elasticsearch 完整格式的 URL 进行分词,有什么好的解决方案吗?

我想对完整格式的 url 进行分词,请问有什么好的解决方案吗?

比如:https://www.abc.com/any/path?param_1=so+me&param-2=other#title

看了官方的分词器,感觉没啥合适的?

预处理的话,又不知道该怎么处理更合适?

因为我们的数据量比较大,不太想用 pattern,感觉集群的压力会升高?

我看这个分词器会把识别的 url 当作一个token,但我想实现的是,对 url 尽可能保证精准的拆分。

Elasticsearch 使用误区之五——单次请求获取大量数据

在使用 Elasticsearch 进行数据查询时,很多开发者、读者会遇到这样的问题:一次性检索大量数据,导致查询速度缓慢、网络延迟增加,甚至影响系统的整体性能。

单次获取过多数据不仅增加了网络传输的负担,还会使查询过程复杂化,降低响应速度。

本文将深入探讨该误区的常见场景、错误原因以及优化方案,帮助大家有效避免这个常见的性能陷阱。

深入解密 Elasticsearch 查询优化:巧用 Profile 工具/API 提升性能

在使用 ES 进行检索查询时,我们常常要去优化一些复杂的查询语句,这里 ES 结合 lucene 的生态制作了 Profile API 和图形化的 Profile 分析界面以供用户使用。

探究:Elasticsearch 文档的 _id 是 Lucene 的 docid 吗?

之前在与研发进行 ES 使用优化的过程中,研发的同事饶有兴致的在会议后问了我这么一个问题:我们写入 ES 的 _id 字段和 lucene 中使用的 docid 是一个内容么?

图解 Elasticsearch 的 Fielddata Cache 使用与优化

在 ES 使用的几个内存缓存中,fielddata cache 算是一个让人头疼的家伙。

作为和 query cache 和 request cache 一样不受 GC 控制的内存使用者,fielddata cache 虽然也有 indices.fielddata.cache.size 的设置来阻止过度使用,但是默认是不限制的。

并且,当 fielddata cache 达到 indices.fielddata.cache.size 设定值的时候,虽然有类似LRU的清理算法,但是官方还是建议你进行手工清理。

那么 fielddata cache 是被什么内容使用了呢?它的作用是什么呢?我们结合官方的一些资料扒一扒。

浅谈Elasticsearch的入门与实践

本文主要围绕ES核心特性:分布式存储特性和分析检索能力,介绍了概念、原理与实践案例,希望让读者快速理解ES的核心特性与应用场景。

Elasticsearch Filter 缓存加速检索的细节,你知道吗?

ES 进行信息检索的时候,boolean 查询组合条件有 must/must_not/should/filter四个操作。

其中 must 和 filter 的用途都是用于过滤必要符合的条件,但是 filter 在查询过程中不算分并且可以进行缓存,这样逻辑简单又可以加速的查询方式经常得到官方的提倡。

可是,只有 filter 的条件可以被缓存么?这里的缓存是属于哪一部分?

缓存有什么样的进入和淘汰机制?怎么去监控缓存的使用情况?

深入解析 Elasticsearch IK 分词器:ik_smart 和 ik_max_word 的区别与应用场景

破解 IK 分词器的秘密:如何选择 ik_smart 和 ik_max_word 模式?

Elasticsearch 自动插入东八区默认时间实现

在 Elasticsearch 中,虽然没有直接设置字段默认值的机制,但可以通过其他方式实现类似的功能。

Elasticsearch ILM 热节点迁移至冷节点 IO 打满、影响读写解决方案探讨

ILM(索引生命周期管理) 遇到热数据迁移至冷节点时造成 IO 打满影响读写的情况。

Elasticsearch 企业级实战 01:Painless 脚本如何调试?

在企业级应用中,Elasticsearch 常常被用来处理复杂的数据查询和操作。

深入解析 Elasticsearch 8.X 索引模板:从传统到可组合模板的全面指南

在 Elasticsearch 中,索引模板用于定义索引的创建预设,包括映射、设置和别名等。

Elasticsearch 提供了两种类型的索引模板:传统模板(Legacy templates)和可组合模板(Composable templates)。

了解这两种模板的使用及其互动方式,对于有效管理索引至关重要。

Elasticsearch 数组全量实战操作指南

在 Elasticsearch 中处理复杂数据类型如数组时,提供了极高的灵活性,但同时也带来了一定的复杂性,尤其在使用脚本进行高级查询和数据操作时。

本文旨在通过一系列实战案例,展示如何有效地在 Elasticsearch 中使用脚本来处理数组类型的字段。

Elasticsearch8实践: 新功能和特性解析

技术研发中心平台架构团队关于Elasticsearch 8.x功能与特性的分享。介绍了ES8.x在性能提升、成本降低及新增特性方面的优势;同时为降本增效,中间件搜索团队升级了二向箔搜索引擎服务平台以支持ES8.x的使用。

Elasticsearch 8.x 存储有无压缩?能压缩到多少?

文章主要介绍了Elasticsearch的压缩功能以及压缩算法。默认情况下,Elasticsearch使用LZ4压缩算法进行数据压缩,但也可以选择best_compression算法以获得更高的压缩比。文章通过实验证明,LZ4算法可以将存储空间压缩到一半,而best_compression算法可以将存储空间压缩到原始空间的35%。对于对压缩比要求较高的情况,推荐使用best_compression算法。同时,通过优化建模参数等方式可以进一步提高压缩效果。

Home - Wiki
Copyright © 2011-2025 iteam. Current version is 2.139.0. UTC+08:00, 2025-01-05 10:16
浙ICP备14020137号-1 $Map of visitor$