AI工程：RAG的相关资料

从零搭建企业级RAG知识库问答系统

RAG技术通过检索、增强、生成三步，结合企业知识库与大模型，提供精准、可溯源的答案。搭建RAG系统需数据准备、向量生成与存储、文档检索、上下文构建与答案生成。优化数据质量、向量模型、索引结构及Prompt设计，可提升系统性能与回答准确性。

360技术

使用RAG技术构建企业级文档问答系统：生成优化(2)使用Unsloth对LLM进行微调

Unsloth微调Qwen3-1.7B实战：垂直领域效果提升显著！通过混合精度训练显存仅需模型16倍大小，1.7B小模型微调后得分从0.7跃至0.78，逼近7B量化版性能。微调侧重风格学习而非知识注入，配合RAG效果更佳。附Colab教程和HuggingFace模型，GTX1080Ti也能跑！

怎么短平快地把RAG做好：厦门银行RAG初赛方案分享

这篇分享揭秘了金融监管问答比赛的实战技巧！作者采用RAG架构，从文档解析、智能切块到混合检索层层优化，特别注重prompt设计和多模型融合。关键点在于：256/512双切块策略平衡精度与覆盖，BM25+向量检索+重排序三重保障，以及针对选择题/问答题的差异化处理。微调Qwen3模型后效果显著提升，最终通过投票融合进一步优化结果。干货满满，值得NLP从业者参考！

RAG 检索策略：BM25、Embedding 和 Reranker 万字深度解析

检索增强生成（RAG）通过结合检索与生成模型提升LLM回答准确性。BM25算法精准匹配关键词但忽略语义，Embedding检索则捕捉语义但不够精准。混合检索策略优于单一方法。Reranker通过交叉注意力机制精细排序，显著提升检索质量。未来，技术组合将更灵活，适应不同场景需求。

鹅厂实习生血泪贴：Agent/RAG黑科技，真相竟是这样！

RAG（检索增强生成）通过检索外部知识库增强AI回答的准确性，避免"幻觉"。其流程包括检索、增强、生成三步骤，核心指标为召回率和忠实度。优化方法涵盖知识库结构化、混合检索策略、生成内容引用等。LLM Agent则通过规划、记忆、工具使用等模块，实现自主决策与任务执行。两者结合，AI从聊天助手进化为全能智能体，处理复杂任务的能力显著提升。

腾讯技术

好未来基于大模型 RAG+CoT 技术辅助故障定位

大模型技术正革新运维故障定位！传统人工排查面临告警杂乱、效率低下等痛点，而AI凭借海量数据处理、标准化流程和极速响应优势脱颖而出。我们构建了基于大模型的智能Agent系统，结合CoT思维链和RAG检索技术，实现自动化根因分析——从提取告警特征、调用检测工具到关联历史标注，形成闭环诊断。升级版多Agent架构更突破单点局限，让故障定位迈向智能化新时代。

好未来技术

Neo4j+GraphRAG：法律合同分析新工具

法律合同分析新突破！通过GraphRAG技术将合同转化为知识图谱，结合LLM智能提取关键条款、参与方等结构化数据。这种混合方法比传统检索更精准，能回答复杂查询如"上月签署合同数"。开源方案已实现端到端流程，包括图构建、代理工具链和Web应用演示，为法律科技带来高效分析新范式。

推理模型+RAG+Agent，作业帮内部安全体系建设实践

在AI大模型和智能化技术推动下，信息安全面临复杂挑战。企业构建了“网络边界-传输链路-终端设备”三层防御体系，但面临告警过载、响应迟滞和知识断层等问题。通过大模型+RAG+AI agent的智能决策方案，实现了告警自动处置，提升效率与精准度，构建了自适应内网安全体系，推动安全运营向智能化、自动化发展。

作业帮技术

RAG技巧与底层代码剖析

用Python基础库从零构建RAG系统，深入解析文本分块、向量化、语义搜索与生成优化。通过智能分块、动态上下文压缩等9大技巧，提升回答质量。从PDF提取文本到生成响应，逐行代码剖析RAG内核，助你彻底掌握底层逻辑，突破调参瓶颈，实现高效检索增强生成。

阿里巴巴技术

Cursor也会犯错？Milvus如何用MCP+RAG解决AI Coding生成过时代码的问题

大模型生成的代码常因知识滞后而不适配最新技术，导致开发者需手动修改。为解决这一问题，Milvus推出了Code Helper MCP，结合RAG技术，自动获取最新文档，生成准确代码。该方案通过MCP架构和SSE传输，确保知识库实时更新，提升开发效率。未来计划集成更多IDE，联动文档管理平台，开源部分能力，持续优化工具链。

Agentic RAG: Company Knowledge Slack Agents

AI知识代理能快速检索内部文档，帮助员工在Slack等平台中迅速获取答案，减少信息筛选时间。尽管像IBM的AskHR已在大公司应用，这类工具尚未普及。本文将探讨构建此类代理所需的工具、技术、架构及其经济成本，并分析开发过程中需重点关注的环节。

Enhanced Agentic-RAG: What If Chatbots Could Deliver Near-Human Precision?

Uber内部开发了Genie，一个基于LLM的Slack机器人，用于实时解答工程安全和隐私领域的查询。通过改进RAG架构，引入增强型代理RAG（EAg-RAG），Genie显著提升了回答的准确性和相关性。该框架优化了文档处理、检索和生成流程，减少了工程师的工作负担，提高了整体效率。未来，Genie将进一步扩展功能，支持多模态内容处理，并引入自检机制，以应对更复杂的查询需求。

uber技术

除了稀疏稠密检索,第三层检索来了！推理信息检索让RAG真正理解你在问什么！

信息检索有三个层次：关键词、语义和推理检索。推理检索需要逻辑思考，理解问题背后的含义，而非简单的字面匹配。现有模型在复杂推理问题上表现不佳，但新模型Reason-ModernColBERT在BRIGHT基准测试中展现了潜力。它通过多向量架构更好地捕捉文档的多样性，提升检索的准确性和深度。推理检索将推动搜索技术向更高层次的智能化发展，改变信息获取方式。

如何利用已有问答数据对构建RAG

问答数据因其结构化特点，在构建RAG系统时具有独特优势。关键策略包括：数据入库时权衡完整性与颗粒度，索引构建以问题为中心，检索和生成策略需灵活设计。实际应用中，注重数据质量、元数据增强和用户反馈闭环。处理复杂问题时，采用层级结构；面对数据质量参差不齐，实施分层策略。技术选型上，推荐使用向量数据库、嵌入模型、大语言模型和检索框架。持续优化是打造实用智能问答系统的关键。

Late Chunking×Milvus：如何提高RAG准确率

在RAG应用中，Late Chunking通过先向量化再分块的方式，有效保留了长文档的上下文信息，提升了召回内容的准确性。相比传统分块，Late Chunking生成的块Embedding编码了更多上下文，减少了LLM调用量，提高了查询相关度。实验表明，Late Chunking在Milvus中的查询效果显著优于传统方法，成为RAG应用的高效解决方案。

RAG 2.0 深入解读

RAG 2.0时代，多模态融合、混合检索优化等技术推动了大模型落地。面对多模态支持不足、检索质量与噪声、生成幻觉与冗余等挑战，RAG通过混合搜索、DPR、重排序、多模态RAG、强化学习、GNN等技术升级，提升了复杂推理任务的处理能力。Agentic RAG引入智能代理，增强了系统的自主决策与规划能力，进一步优化了检索与生成效率。

阿里巴巴技术