中间件与数据库:Milvus
CLIP+Milvus,多模态embedding 如何用于以文搜图
想要在朋友圈优雅地装文艺?用多模态embedding模型CLIP,轻松实现古诗词配图!通过将文本和图片映射到同一向量空间,CLIP能拉近语义相近的文本和图片距离,实现以文搜图、以图搜图。本文手把手教你搭建系统,从安装Milvus、加载模型到数据插入、索引创建,最后展示检索结果。无论是“枯藤老树昏鸦”还是“夕阳西下”,都能找到意境相符的图片,让你的朋友圈瞬间文艺感拉满!
用Qwen3 Embedding+Milvus,搭建最强企业知识库
阿里低调发布Qwen3-Embedding和Qwen3-Reranker两款新模型,支持119种语言,在多语言任务中表现优异。教程手把手教你用这两款模型搭建RAG系统,通过两阶段检索设计(召回+重排)平衡效率与精度。从环境准备、数据加载到结合重排序技术增强RAG,完整流程清晰易懂,适合开发者快速上手。
Cursor也会犯错?Milvus如何用MCP+RAG解决AI Coding生成过时代码的问题
大模型生成的代码常因知识滞后而不适配最新技术,导致开发者需手动修改。为解决这一问题,Milvus推出了Code Helper MCP,结合RAG技术,自动获取最新文档,生成准确代码。该方案通过MCP架构和SSE传输,确保知识库实时更新,提升开发效率。未来计划集成更多IDE,联动文档管理平台,开源部分能力,持续优化工具链。
Late Chunking×Milvus:如何提高RAG准确率
在RAG应用中,Late Chunking通过先向量化再分块的方式,有效保留了长文档的上下文信息,提升了召回内容的准确性。相比传统分块,Late Chunking生成的块Embedding编码了更多上下文,减少了LLM调用量,提高了查询相关度。实验表明,Late Chunking在Milvus中的查询效果显著优于传统方法,成为RAG应用的高效解决方案。
不止语义检索,Milvus+LangChain全文检索RAG教程来了
OpenAI与LangChain在AI agent开发理念上存在分歧,OpenAI侧重高级抽象加速开发,LangChain则强调精确控制确保可靠性。现代向量数据库如Milvus通过稀疏向量和密集向量协同工作,支持全文检索和语义搜索。本文详细解析了如何利用LangChain和Milvus构建RAG系统,展示了从文档加载、分割到向量化存储的完整流程,并提供了解决实际问题的经验总结。
RAG 系统高效检索提升秘籍:如何精准选择 BGE 智源、GTE 阿里与 Jina 等的嵌入与精排模型的完美搭配
MTEB和C-MTEB是评估文本嵌入模型性能的基准,涵盖多种任务、数据集和语言。BGE-M3、GTE、E5、Jina Embedding V3等模型在多语言、多功能和多粒度方面表现优异,支持长文本处理和高性能检索。这些模型通过创新技术如自知识蒸馏、LoRA适配器等,提升了文本嵌入的准确性和适用性,广泛应用于搜索、问答和大语言模型等领域。
Milvus×滴滴:超3000w SKU的商超检索系统是如何炼成的
滴滴的Grocery业务利用向量数据库技术改进生鲜电商搜索系统,通过Milvus和jina-embeddings-v3模型实现多语言支持和容错性。通过语义向量化,解决拼写错误和多语言搜索问题,提高搜索准确性和用户体验。上线后,向量搜索提升了搜索结果的转化效率,未来计划动态更新数据、个性化推荐和混合搜索,以进一步提升系统表现。Jina在多语言支持中表现优异,尤其在西语环境中效果突出。
哈啰:构建智能出行RAG,ES还是向量数据库?
从ES到Milvus再到Zilliz Cloud,RAG助力哈啰在大模型时代自我进化。
Building a GraphRAG Agent With Neo4j and Milvus
Build a GraphRAG Agent using Neo4j and Milvus. By combining the strengths of graph databases and vector search, this agent provides accurate and relevant answers to user queries.
图像搜索的新纪元:Milvus与CLIP模型相伴的搜图引擎
本文介绍了Milvus的技术原理和对CLIP模型的应用。通过将Milvus和CLIP相结合,我们可以构建出一种强大的搜图引擎,使用户能够通过文本描述或者上传的图片进行准确的图像搜索。
陌陌向量检索引擎工程实践
全球每天产生的数据中,有80%是非结构化数据,常见的非结构化数据包括语音、图片、视频和语言文字等。通过深度学习等技术训练得到的模型对非结构化数据进行特征提取,将非结构化数据转换成一个多维的向量,这个过程称作Embedding。多维向量本质上是对非结构化数据在高位空间的映射,而向量检索就是对这些生成的向量进行检索,从中找到最相似的若干个向量。
非结构化检索本质是向量检索技术,其主要的应用领域如人脸识别、推荐系统、图片搜索、视频指纹、语音处理、自然语言处理、文件搜索等。随着AI技术的广泛应用,以及数据规模的不断增长,向量检索也逐渐成了AI技术链路中不可或缺的一环,更是对传统搜索技术的补充,并且具备多模态搜索的能力。
基于Milvus的向量搜索实践(二)
本篇主要讲针对低延时、高吞吐需求,对Milvus部署方式的一种定制方案。
ChatGPT分享-如何开发一个LLM应用
AI产业的分工初步形成,包括底层基础设施(云服务商)、大型模型、Prompt Engineering平台和终端应用。随着AI产业变革,开发者可以充分利用大型语言模型(LLM)和Prompt Engineering来开发创新应用。
Elasticsearch 向量搜索的工程化实战
作为一家搜索引擎公司,我们会很倚赖 ES 帮忙处理包括文章召回,数据源划分,实体、标签管理等任务,而且都收到了不错的结果。
最近我们需要对行业知识库进行建模,其中可能会涉及到实体匹配、模糊搜索、向量搜索等多种召回和算分方式,最终我们选择了通过 ES 7.X (最终选择 7.10)里的新功能,Dense vector 帮忙一起完成这部分的需求。
Milvus探究与压测分析
最近用到了向量搜索,所以要对milvus进行压测。同时为了更加深入分析压测中遇到的问题,也对milvus的部分源码与文档进行了走读。其中遇到了一些问题与疑惑,我们也直接与milvus社区或开源贡献者沟通。
通过压测,我们发现某场景下存在milvus的性能提升不上去的问题,并给出基于该场景的解决方案,社区反馈给milvus官方。
以下为milvus的设计与压测中遇到的一些问题与解决或跟进方案。
基于WVP的轻量化智能监控平台
当代智能监控平台不乏功能强大的产品,但由于涉及模块、组件多,产品容易臃肿,对私有化场景增加了一定的阻碍。于是,轻量化智能监控平台很有必要。