AI工程：RAG的相关资料

bili-fe-workflow —商业化智能开发工作流实践

本文提出从Prompt工程到Harness Engineering的演进，通过“.workflow”知识库和标准化工作流，将AI融入需求、开发、测试全链路。核心在于“模仿+拆解”，让AI在固定节点协作，将个人经验沉淀为团队能力，实现稳定提效。

一个真实的智能客服RAG，数据准备到检索链路完整拆解

香水电商智能导购RAG系统全链路拆解：数据切分需按标题层级保证语义完整，chunk控制在300-500token；用反向生成question匹配用户口语表达；召回Top-20后经Reranker精排Top-5，双阈值设计兼顾效率与容错。错别字召回失败要调阈值，回答泛泛需优化chunk粒度，核心在于各环节决策的对齐而非单一调参。

RAG已死？不，是Grep回归了！

RAG在代码搜索领域正被LLM驱动的Grep方案颠覆！Claude Code放弃向量索引，用多轮ripgrep暴力扫描实现零延迟检索，实测4,500文件仅需0.1秒。核心在于代码标识符天然适合精确匹配，且本地项目规模撑得住暴力搜索。虽然token消耗较高，但通过子Agent隔离、历史压缩等优化仍具实用性。这波技术迭代证明：特定场景下，简单直接的方案可能比复杂架构更高效。

AI手工测试用例的实践进阶之路

传统手工测试用例面临信息碎片化、时间窗口压缩、个人经验依赖等问题。AI用例生成项目通过MVP验证方向，1.0阶段补齐输入解析、Prompt工程化等关键能力，最终沉淀为测试智能体平台。核心在于升级测试设计链路，实现多源输入协同、过程治理和资产闭环，提升覆盖质量与生成效率，推动测试工程体系智能化演进。

本文分享了一个基于Spring AI的AI Agent开发实践，通过生成代码来学习AI Agent开发。项目集成了RAG、Function Calling、MCP、SubAgent等核心模块，展示了从意图识别到工具调用的完整流程。AgentCore作为系统大脑，负责编排对话流程，ChatMemory管理对话记忆，Tool机制让LLM具备调用工具的能力。RAG模块通过多路召回和Rerank实现知识库检索，Command和Skill提供了两种Prompt模板机制，SubAgent支持独立记忆的任务执行。MCP协议实现了与外部服务的动态连接，扩展了Agent的能力边界。整个项目体现了AI Agent开发的工程化思路，Function Calling作为核心地基，支撑了多种复杂能力的实现。

Anthropic-Style Citations with Any LLM

这篇文章教你如何为任何大语言模型（LLM）自建类似Anthropic的自动引用功能。通过向量数据库存储文本块，检索后让LLM生成带<CIT>标签的回答，解析后实现交互式引用展示。核心步骤包括分句处理、精准标注、解析响应和可视化呈现，最终能像Claude一样实现句级溯源。虽然比官方方案复杂，但通用性强，适合非Claude用户实现专业级引用效果。

Reducing Agentforce AI Debugging from Two Weeks to Same-Day with Query-Driven Observability

爱因斯坦笔记本平台通过Spark工作流，将AI调试时间从两周缩短至一天，支持超4亿条记录和800GB数据的实时查询。团队开发了统一工作流，实现生产数据的直接访问，解决了传统日志和指标的局限性。通过多租户隔离和高性能架构，确保安全的查询驱动调试，提升AI代理行为透明度和调试效率。

salesforce技术

用RAG的思路做agent知识管理，为什么跑不通

RAG系统在Agent知识管理中面临相似度高不等于正确的问题，跨页面答案和chunk拼合时表现不佳。VKFS通过在向量数据库上构建知识交互层，采用文件系统逻辑让Agent更自然地探索知识。VKFS支持目录浏览、文件读取和精准搜索，优化了知识获取流程，提升了Agent的灵活性和效率。

AI 答疑助手优化实践：从 RAG 到 LightRAG 的全链路升级

传统RAG存在意图识别模糊、知识碎片化及缺乏评测闭环等问题。通过思维链驱动的意图识别，将用户问题分解为多步逻辑查询并并行检索，提升查询精准度。LightRAG通过实体关系抽取与双层检索范式，实现秒级响应与增量更新。多维评测体系克服模型“过度自信”，持续提升答疑系统的上下文构建能力。

AI数据工程师在应用中如何"返璞归真"

AI Agent构建需超越轻量级模式，面对知识质量、语义理解与规模化维护挑战。应从Prompt-Centric转向Context-Aware，构建结构化、可推理的上下文语料体系，提升语义对齐与工具集成标准化。通过本体建设与RAG升级，实现精准理解、可靠推理与高效执行，降低系统性幻觉，提升AI决策的可解释性与业务价值。

从 Vibe Coding 到范式编程：用 Spec 打造淘系交易的 AI 领域专家

AI编程正从“Vibe Coding”向“范式编程”演进，核心是通过结构化规范驱动AI生成企业级代码。当前AI工具因缺乏领域知识和规范约束，生成代码不可靠、难维护。范式编程将规范置于开发中心，结合知识库与AI Agent，构建可沉淀、复用的AI领域专家体系，实现人机协同的范式升级，提升代码质量和效率。

The AI Evolution of Graph Search at Netflix: From Structured Queries to Natural Language

Netflix利用大型语言模型（LLM）将自然语言查询转换为Graph Search Filter DSL，简化了复杂数据搜索流程。通过检索增强生成（RAG）技术，系统精准匹配用户意图，生成语法、语义正确的查询语句。同时，结合上下文工程和后处理验证，确保查询结果的准确性和可信度，提升了用户体验和搜索效率。

netflix技术

知识基座：让“AI 越用越懂业务”的团队经验实践【天猫AI Coding实践系列】

通过构建“AI全栈研发知识基座”，团队系统化梳理业务文档、代码规范等，结合RAG技术嵌入研发流程，提升AI对业务上下文的理解能力。通过信号驱动的智能沉淀机制，自动捕获隐性经验，实现团队知识共享与动态迭代，显著提高研发效率，让AI成为懂业务的智能伙伴。

拒绝重复造轮子！抽象 80% 工作场景，打造可复用的"AI 助手工厂”

AI助手开发常陷入重复造轮子困境，智空间团队将80%高频场景抽象为四大类：复杂指令、知识问答、问题排查和极简场景，并针对每类设计可复用技术方案。通过Prompt插拔架构和分层解耦系统，实现业务方"配"而非"开发"助手。平台沉淀四大模板，内置框架Prompt与业务定制接口，显著降低开发门槛，让专家专注经验沉淀，推动AI应用从"作坊"迈向"工厂"模式。

阿里巴巴技术

从RAG到GraphRAG：货拉拉元数据检索应用实践

RAG技术结合信息检索与文本生成，提升回答准确性与可信度。GraphRAG进阶引入知识图谱，优化检索与生成过程，增强复杂问题推理能力。方案从Naive RAG到GraphRAG，逐步解决召回率与准确率问题，显著提升问答质量与业务效率。未来将持续优化检索能力和Agentic RAG应用，推动元数据检索系统进一步发展。

货拉拉技术

我给 OpenClaw 杀了 47 次僵尸进程，终于想明白了一些事

OpenClaw虽火但坑多，Gateway单点故障频发，钉钉集成体验割裂。其成功在于将"万能AI助理"概念具象化，30万Star背后是技术叙事的力量。本地模式自由但风险自担，云端方案省心却受限。Skill模式颠覆传统工程，但架构决策仍需人力。AI写代码易，做产品难，测试覆盖救不了体验短板。未来已来一半，既别神话也别抵抗，赶紧上手才是真。

阿里巴巴技术