Elasticsearch 8让企业更快更好落地RAG应用
如果无法正常显示,请先停止浏览器的去广告插件。
1. 朱杰
Elastic中国首席解决方案架构师
2.
3. 160K+
Commits
120亿+
Elastic Cloud
每天搜索的量
200K+
Pull Requests
110K+
GitHub Stars
46亿+
累计下载量
4. 向量搜索
语义搜索
过去需求
全文搜索
聚合统计
分词
结构化搜索
复杂混合搜索
排序调优
向量和经典搜
索的混合
模型重排序
RAG
现在需求
5. 文档加工 切片
Query理解 改写扩充
LLM
Prompt 重排序
评测指标 RAG定制模型
索引构建
Elasticsearch
多路召回
6. 文档加工 切片
Query理解 改写扩充
LLM
Prompt 重排序
评测指标 RAG定制模型
索引构建
Elasticsearch
多路召回
7. 大多数的向量数据库
混合搜索
(文本 + 向量)
存储和搜索
向量
一些向量数据库
Elasticsearch
● 基于HNSW的索引
● 原生向量数据库,并非是插件
● 与现有ES搜索功能高度融合进行混合搜索
embedding
模型
过滤 & 切面
创建
Embeddings
开箱即用的
训练模型
文档级别安全
自动提示
搜索分析
聚合
文本, 地理位置搜索
数据摄取 (web crawler,
connectors, Beats, Agent,
API framework)
自部署 / 云
/ 混合云
8. 增加单个查询并发
硬件加速
利用CPU硬件指令加速向
量索引和计算速度
增加查询并发度,充分利用
更多的计算核心
更快
更强
向量量化 并发查询间协同
向量有损压缩,float到
int8、int4来平衡精度、速
度和成本 一个查询的多个并发线程间
协同共享信息,提前终止一
些查询线程
9. 利用更多硬件能力
并全面应用到其它搜索和
计算
Panama Vector API 实
现确定的向量化
SIMD指令
FMA指令
编译器自动向量化
Panama Foreign
Function Interface (FFI)
调用本地代码
Elasticsearch会更多利用
ARM 本地优化代码
本地代码
X86 本地优化代码
Elasticsearch进一步利
用本地代码进行加速
Lucene利用硬件加速
阿里云ES 8.13 将会全面启用硬件加速能力
10. 以前
• 集群整体吞吐优先
• 限制单个查询的资源
• 每个查询每个分片一个查询线
程
现在
• 每个查询每个分片中的段一个
查询线程
• 改进了搜索延迟
• 可以重复利用更多核心数
• 应用到其它搜索领域
• 并发间协调
11. ●
●
●
●
●
转化向量的数据类型 float32 to Int8 Int4
○ 大多数模型输出 float32 类型的向量
○ Int8 Int4 可以更好的在精度、性能、成本之
间平衡
对精度有一定影响
○ 通过增加候选数量来缓解
优化了索引的大小
增强搜索性能、降低搜索延迟
增强索引性能
12. BM25
文本搜索
第三方Embedding模型
密集向量
text
embeddings
密集向量
image
embeddings
RRF
Elasticsearch Search APIs
强大的语义和混合搜索
稀疏向量
13.
14. •
一个文档确定的多个向量字段
○ 标题、摘要
•
不确定数量的一组向量
○ 每个段落一个向量
• 语义搜索,融合
• 文档切片的需要
Document
X 1
X 2
X 3
…
X n
X 1
X 2
X 3
…
X n
X 1
X 2
X 3
…
X n
15. $ eland_import_hub_model
--url https://Cluster_URL --hub-
model-id bert_model --task-type
text_embedding --start
Huggingface
eland
16. 阿里云 Elasticsearch
Inference API
embedding、chat、rerank
Elasticsearch
直接部署模型
私有化部署的模型
例如:阿里云 PAI
在线推理服务
例如:阿里云 DashScope
17. 企业认证
服务集成
精细化
权限控制
基于规则的
关键词过滤
精细化控制 索引级别 通过构建规则
需要有和集中认证 字段级别 混合搜索中精确过滤掉敏
服务整合的能力 文档级别 感信息
18. 阿里云
Elasticsearch
8.13 +
19. 全新的计算引擎
ES|QL
全面的Search AI
能力
更强更快更简单的
向量引擎
云原生
Serverless化
20. elastic.co/search-labs
elastic.co/observability-labs
elastic.co/security-labs
21.