话题AI工程 › RAG

AI工程:RAG

关联话题: GraphRAG、Retrieval-Augmented Generation、检索增强生成

Neo4j+GraphRAG:法律合同分析新工具

法律合同分析新突破!通过GraphRAG技术将合同转化为知识图谱,结合LLM智能提取关键条款、参与方等结构化数据。这种混合方法比传统检索更精准,能回答复杂查询如"上月签署合同数"。开源方案已实现端到端流程,包括图构建、代理工具链和Web应用演示,为法律科技带来高效分析新范式。

推理模型+RAG+Agent,作业帮内部安全体系建设实践

在AI大模型和智能化技术推动下,信息安全面临复杂挑战。企业构建了“网络边界-传输链路-终端设备”三层防御体系,但面临告警过载、响应迟滞和知识断层等问题。通过大模型+RAG+AI agent的智能决策方案,实现了告警自动处置,提升效率与精准度,构建了自适应内网安全体系,推动安全运营向智能化、自动化发展。

RAG技巧与底层代码剖析

用Python基础库从零构建RAG系统,深入解析文本分块、向量化、语义搜索与生成优化。通过智能分块、动态上下文压缩等9大技巧,提升回答质量。从PDF提取文本到生成响应,逐行代码剖析RAG内核,助你彻底掌握底层逻辑,突破调参瓶颈,实现高效检索增强生成。

Agentic RAG: Company Knowledge Slack Agents

AI知识代理能快速检索内部文档,帮助员工在Slack等平台中迅速获取答案,减少信息筛选时间。尽管像IBM的AskHR已在大公司应用,这类工具尚未普及。本文将探讨构建此类代理所需的工具、技术、架构及其经济成本,并分析开发过程中需重点关注的环节。

Enhanced Agentic-RAG: What If Chatbots Could Deliver Near-Human Precision?

Uber内部开发了Genie,一个基于LLM的Slack机器人,用于实时解答工程安全和隐私领域的查询。通过改进RAG架构,引入增强型代理RAG(EAg-RAG),Genie显著提升了回答的准确性和相关性。该框架优化了文档处理、检索和生成流程,减少了工程师的工作负担,提高了整体效率。未来,Genie将进一步扩展功能,支持多模态内容处理,并引入自检机制,以应对更复杂的查询需求。

除了稀疏稠密检索,第三层检索来了!推理信息检索让RAG真正理解你在问什么!

信息检索有三个层次:关键词、语义和推理检索。推理检索需要逻辑思考,理解问题背后的含义,而非简单的字面匹配。现有模型在复杂推理问题上表现不佳,但新模型Reason-ModernColBERT在BRIGHT基准测试中展现了潜力。它通过多向量架构更好地捕捉文档的多样性,提升检索的准确性和深度。推理检索将推动搜索技术向更高层次的智能化发展,改变信息获取方式。

如何利用已有问答数据对构建RAG

问答数据因其结构化特点,在构建RAG系统时具有独特优势。关键策略包括:数据入库时权衡完整性与颗粒度,索引构建以问题为中心,检索和生成策略需灵活设计。实际应用中,注重数据质量、元数据增强和用户反馈闭环。处理复杂问题时,采用层级结构;面对数据质量参差不齐,实施分层策略。技术选型上,推荐使用向量数据库、嵌入模型、大语言模型和检索框架。持续优化是打造实用智能问答系统的关键。

Late Chunking×Milvus:如何提高RAG准确率

在RAG应用中,Late Chunking通过先向量化再分块的方式,有效保留了长文档的上下文信息,提升了召回内容的准确性。相比传统分块,Late Chunking生成的块Embedding编码了更多上下文,减少了LLM调用量,提高了查询相关度。实验表明,Late Chunking在Milvus中的查询效果显著优于传统方法,成为RAG应用的高效解决方案。

RAG 2.0 深入解读

RAG 2.0时代,多模态融合、混合检索优化等技术推动了大模型落地。面对多模态支持不足、检索质量与噪声、生成幻觉与冗余等挑战,RAG通过混合搜索、DPR、重排序、多模态RAG、强化学习、GNN等技术升级,提升了复杂推理任务的处理能力。Agentic RAG引入智能代理,增强了系统的自主决策与规划能力,进一步优化了检索与生成效率。

告别碎片化!两大先进分块技术如何提升RAG的语义连贯性?

检索增强生成(RAG)系统通过结合自然语言处理与信息检索技术,解决了传统大语言模型依赖静态数据的局限。文章探讨了两种分块策略:延迟分块保留全局上下文,提升效率;上下文增强检索通过LLM生成附加信息,提升语义连贯性。实验表明,延迟分块适合资源有限场景,上下文检索则在高精度需求下表现更优。未来需平衡效率与效果,优化长文档处理。

基于LangChain ReAct Agents构建RAG问答系统

LLM在处理私有数据时易产生“幻觉”,RAG技术通过检索外部知识库辅助回答,但在多步推理问题上仍有局限。本文引入LangChain ReAct Agents,结合ReAct框架,通过“思考-行动-观察”循环提升复杂任务表现。系统使用Qdrant向量数据库和LangChain工具,实现多步推理与知识检索,显著提高回答准确性。

GraphRAG在企业知识服务中的应用落地

GraphRAG技术通过知识图谱与大模型深度融合,解决工业场景中RAG技术的局限性。知识图谱的结构化表达和高效检索能力,弥补了大模型在专业领域知识的不足,提升问答准确率。技术实现路径涵盖数据处理、图谱构建、智能问答等环节,优化企业知识管理与应用效能,为工业制造业提供创新解决方案。

Building Dash: How RAG and AI agents help us meet the needs of businesses

Dropbox Dash 是一款集成了 AI 功能的通用搜索和知识管理工具,旨在解决信息碎片化问题。通过机器学习和生成式 AI,Dash 提供强大的搜索体验,支持跨应用内容查找、组织和保护。其核心采用检索增强生成(RAG)技术,结合 AI 代理,处理复杂任务。Dash 高效应对数据多样性、碎片化和多模态挑战,提升企业的协作和生产力,同时确保信息安全。

不止语义检索,Milvus+LangChain全文检索RAG教程来了

OpenAI与LangChain在AI agent开发理念上存在分歧,OpenAI侧重高级抽象加速开发,LangChain则强调精确控制确保可靠性。现代向量数据库如Milvus通过稀疏向量和密集向量协同工作,支持全文检索和语义搜索。本文详细解析了如何利用LangChain和Milvus构建RAG系统,展示了从文档加载、分割到向量化存储的完整流程,并提供了解决实际问题的经验总结。

一文搞懂:RAG、Agent与多模态的行业实践与未来趋势

大模型通过RAG、Agent与多模态技术推动AI与现实的交互边界扩展。RAG增强数据时效性与专业性,Agent赋予自主决策能力,多模态技术提升跨模态理解。三者协同解决数据隐私、专业适配等难题,推动医疗、金融、制造等行业从效率革新到业务重构,未来将向多模态知识图谱、具身智能与神经符号系统升级,实现感知-认知-决策闭环。

RAG技术演进的四大核心命题

大模型技术迅猛发展,RAG(检索增强生成)成为优化用户体验的关键。通过提升检索与生成准确率,构建智能客服与辅助系统,解决数据垂直化、模型幻觉等挑战。未来,多模态检索、深度推理与评估体系优化将推动RAG技术迈向新高度,提供更智能、精准的服务体验。

Home - Wiki
Copyright © 2011-2025 iteam. Current version is 2.144.0. UTC+08:00, 2025-06-14 21:23
浙ICP备14020137号-1 $Map of visitor$