话题中间件与数据库 › Elasticsearch

中间件与数据库:Elasticsearch

Elasticsearch 8.X DSL 如何优化更有助于提升检索性能?

问题1:bool 组合嵌套过深。

问题2:大量使用 wildcard 查询。

问题3:"track_total_hits": 2147483647 没有必要搞这么大?

问题4:track_scores 确认是否必要使用!

问题5:"_source": {"includes": [ 确认是否必须

问题6:match,match_phrase, wildcard 都混合使用,考虑分词问题解决。

问题7:建议线上使用复杂DSL,可以使用性能测试验证一下。

美团外卖搜索基于Elasticsearch的优化实践

美团基于Run-Length Encoding(RLE)设计了一款高效的倒排索引结构,使检索耗时(TP99)降低了84%。

Stability and scalability for search

In this blog, we discuss how we power real-time search for Tweets, Users, Direct Messages and more using Elasticsearch.

从一个生产的问题分析ElasticSearch负载均衡算法

负载均衡是分布式系统里最常用的能力,实现方式有很多,今天要讲的是遇到的一个真实的生产问题。

图解:Elasticsearch 8.X 如何求解环比上升比例?

环比是统计学术语,表示连续2个统计周期内的量的变化比。

一个线上问题引发的思考——Elasticsearch 8.X 如何实现更精准的检索?

满足用户要求的“精准”才算是精准。

基于 MySQL Binlog 的 Elasticsearch 数据同步实践

用 go-mysql-elasticsearch 实现数据同步的本地化实践。

Elasticsearch percolation to match new real estate listings against saved searches

The realestate.com.au website and mobile applications are used by 12.7 million people on average each month in their search for property. Users can save their search filters so that they may easily repeat searches later. Once a user has saved a search, they have the option to receive daily notifications of new listings that match their search criteria. Supporting this involves matching the thousands of new listings created every day against millions of saved searches. In this article I explain how we use Elasticsearch’s “percolation” feature to help us do this.

Elasticsearch 8.X 路径检索的企业级玩法

Elasticsearch 8.X 路径检索搞不定,怎么办?

Elasticsearch 为什么会产生文档版本冲突?如何避免?

一篇讲透 Elasticsearch 文档版本冲突。

Elasticsearch 8.X 检索实战调优锦囊 001

Elasticsearch 检索响应慢,怎么办?

说说 Elasticsearch filter 和 post_filter 的区别?

能否说说 filter 和 post_filter 的区别?

Elasticsearch 删除重复文档实现方式,你知道几个?

Elasticsearch 8.X 删除重复文档 Python 实现。

记一次Elasticsearch问题排查

我们团队基于Elasticsearch开发了一款将数据从数据库实时同步至Elasticsearch的工具——搜索平台,其实现方式主要是通过flink将数据库中已有的存量数据导入Elasticsearch,并订阅数据表的binlog,将实时改动也同步至Elasticsearch。

AIoT团队在搜索平台上维护了一个较大的索引,其写入平均有2k到3k的tps,查询也有数百QPS。由于该索引较重要且占用资源较多,因此使用Elasticsearch的template功能将之单独部署在专用的机器上。

从5月底开始,写入此索引的flink实时任务就会偶现失败重启的情况,经排查,发现是写入Elasticsearch的请求超时导致的,结合当时机器的cpu占用等指标判定是写入tps过高导致Elasticsearch无法承受,因此,将该索引所占的机器从2台升级到3台,并使用业务数据进行了一轮写入压测,发现能支撑业务方的写入速率,扩完后较长一段时间内,该索引也一直没有出现问题,因此认为问题已经被解决了。

Elasticsearch 获取两个索引数据不同之处的四种方案

假定有两个索引 index1、index2,这两个索引中有大量相同数据。类似:linux 下的 diff 命令的操作,找出一个索引中存在而在另外一个索引不存在的数据。

Elasticsearch 如何实现时间差查询?

es能通过两个字段差值进行查询吗?类似 select * from myindex where endtimes- starttime > 10 这种?

Home - Wiki
Copyright © 2011-2024 iteam. Current version is 2.125.1. UTC+08:00, 2024-05-17 13:21
浙ICP备14020137号-1 $Map of visitor$