话题AI工程 › RAG

AI工程:RAG

关联话题: GraphRAG、Retrieval-Augmented Generation、检索增强生成

The AI Evolution of Graph Search at Netflix: From Structured Queries to Natural Language

Netflix利用大型语言模型(LLM)将自然语言查询转换为Graph Search Filter DSL,简化了复杂数据搜索流程。通过检索增强生成(RAG)技术,系统精准匹配用户意图,生成语法、语义正确的查询语句。同时,结合上下文工程和后处理验证,确保查询结果的准确性和可信度,提升了用户体验和搜索效率。

知识基座:让“AI 越用越懂业务”的团队经验实践【天猫AI Coding实践系列】

通过构建“AI全栈研发知识基座”,团队系统化梳理业务文档、代码规范等,结合RAG技术嵌入研发流程,提升AI对业务上下文的理解能力。通过信号驱动的智能沉淀机制,自动捕获隐性经验,实现团队知识共享与动态迭代,显著提高研发效率,让AI成为懂业务的智能伙伴。

拒绝重复造轮子!抽象 80% 工作场景,打造可复用的"AI 助手工厂”

AI助手开发常陷入重复造轮子困境,智空间团队将80%高频场景抽象为四大类:复杂指令、知识问答、问题排查和极简场景,并针对每类设计可复用技术方案。通过Prompt插拔架构和分层解耦系统,实现业务方"配"而非"开发"助手。平台沉淀四大模板,内置框架Prompt与业务定制接口,显著降低开发门槛,让专家专注经验沉淀,推动AI应用从"作坊"迈向"工厂"模式。

从RAG到GraphRAG:货拉拉元数据检索应用实践

RAG技术结合信息检索与文本生成,提升回答准确性与可信度。GraphRAG进阶引入知识图谱,优化检索与生成过程,增强复杂问题推理能力。方案从Naive RAG到GraphRAG,逐步解决召回率与准确率问题,显著提升问答质量与业务效率。未来将持续优化检索能力和Agentic RAG应用,推动元数据检索系统进一步发展。

我给 OpenClaw 杀了 47 次僵尸进程,终于想明白了一些事

OpenClaw虽火但坑多,Gateway单点故障频发,钉钉集成体验割裂。其成功在于将"万能AI助理"概念具象化,30万Star背后是技术叙事的力量。本地模式自由但风险自担,云端方案省心却受限。Skill模式颠覆传统工程,但架构决策仍需人力。AI写代码易,做产品难,测试覆盖救不了体验短板。未来已来一半,既别神话也别抵抗,赶紧上手才是真。

Embedding相似度虚高,如何用langchain+Milvus搭建CRAG解决?

CRAG系统通过在检索与生成间引入评估环节,解决了传统RAG相似性高分但结果不可用的问题。它将检索结果分为正确、模糊、错误三类,进行精炼与纠正,避免错误信息进入大模型。CRAG采用Milvus向量数据库,支持多租户隔离和混合检索,确保检索质量。评估器快速筛选内容,内部检索不足时触发Web搜索补充,提升时效性和准确性。

OpenClaw怎么可能没痛点?用RDS插件来释放OpenClaw全部潜力

OpenClaw插件是深度介入Agent生命周期的强大扩展机制,相比Skill和Tool能实现更主动的自动化操作。通过24个生命周期钩子,插件可在模型选择、提示词构建、工具调用等关键节点介入,适用于RAG知识注入、记忆持久化等场景。实战案例展示了如何用MySQL插件实现经济新闻自动检索和云端记忆管理,彻底解决本地存储局限。插件开发只需注册工具和钩子,即可灵活扩展OpenClaw核心功能。

Unified Context-Intent Embeddings for Scalable Text-to-SQL

Pinterest构建了一个智能分析代理,通过统一上下文意图嵌入和结构化统计模式,将历史查询转化为可搜索的知识库。该系统结合语义检索与治理感知排名,确保生成的SQL基于已验证模式。AI自动生成文档和基于联动的术语传播大幅降低了人工维护成本,而向量数据库服务支撑了高效检索。最终打造的分析助手能理解业务问题,推荐可靠数据资产并生成高质量SQL,形成自我强化的学习循环。

AI代码审计(逻辑漏洞方向)

AI代码审计新突破!针对逻辑漏洞深水区,提出"图数据库+RAG+CoT"组合方案:先通过AST解析构建代码属性图,精准提取API完整链路;再结合业务规则初筛,降低AI算力消耗;最后用动态Prompt注入和四步推理链(场景识别→防御审计→沙箱模拟→结果判定),实现逻辑漏洞的深度挖掘。这套架构让AI像安全专家一样进行上下文感知的攻防推演,既破解了传统自动化工具难以捕捉业务逻辑漏洞的难题,又通过漏斗模型平衡了成本与效果。

RAG优化字典:20种RAG优化方法全解析

RAG系统优化方法梳理,涵盖分块策略、检索增强、生成质量等维度。语义分块、上下文压缩、查询转换等20种方法,提升检索精准度与生成效果。融合检索、HyDE、Self-RAG等技术,实现语义与关键词互补,减少幻觉。优化方法选择指南,助力RAG系统高效落地。

别再硬扛原生记忆了!OpenClaw内置Mem0,让Agent更省token、更智能

OpenClaw的记忆系统通过文件层和索引层实现跨会话、可回溯的记忆管理,支持Markdown文件和SQLite检索。原生记忆插件存在token消耗大、记忆不筛选等问题。openclaw-mem0-plugin插件引入Mem0,实现记忆精确检索和跨会话管理,安装简单,配置灵活,显著提升记忆效率,适合企业级应用。

让问题不过夜:交易领域“问诊”Agent实践

研发支持工作碎片化、重复性强,依赖个人经验,效率低且质量不稳定。为解决这一问题,我们构建了智能Agent系统,通过业务答疑和问题诊断两类核心能力,实现解释与排查工作的自动化前置。系统采用排查文档技能化和质量评分闭环机制,显著缩短响应时间,提升服务一致性与工程效能,推动研发支持的可规模化、可复用与可运营。

如何用 AI 做业务级 Code Review

代码评审中常面临Diff过多、新人不知历史Bug等问题。打造AI助手,从Git push触发,通过预处理Diff、语义重塑、RAG经验召回等步骤,深度Review并生成报告。实践中优化模型选型、长Diff处理及多Chunk整合,显著降低老事故复发率。未来将解决RAG噪音、一键采纳建议等问题,强化与Cursor及发布平台的集成,让AI成为懂业务的好搭档。

别再让语音机器人“答非所问”:AI Force任务型语音对话技术总结

AI语音助手要像真人一样完成任务,需解决“拟人化”和“专业化”两大难题。通过三段式架构,优化TTS、双工对话和ASR技术,提升语音交互的自然度和反应速度。自研“衍算”框架结合LLM,实现任务高效推进与专业应答,同时降低延迟和成本。未来将探索多Agent协同和泛服务场景适配,持续优化交互体验。

设计模式Trustworthy Generation:提升RAG信赖度

【RAG可信生成设计模式精要】针对检索增强生成(RAG)易出现的幻觉、偏见和信息缺失问题,提出"可解释、可追溯、可反思、可监管"四层解决方案。核心策略包括:设置相似度阈值过滤低关联内容、关键信息标注引用来源、引入自批判机制优化检索质量、构建全流程防护体系。需权衡系统复杂度与误过滤风险,可考虑双知识库交叉验证或置信分标注作为替代方案。(139字)

告别“伪智能”代码:用 Spec + RAG 打造真正懂你的AI程序员

AI Coding时代,代码质量提升的关键在于构建"Spec+RAG+MCP"三位一体的知识体系。Spec作为硬规则确保代码合规性,RAG动态检索非结构化知识补充上下文,MCP则标准化AI与外部服务的交互。通过分层协同,这套体系能显著提升生成代码的准确性、可维护性和业务贴合度,已在淘天集团部分业务线验证效果。未来将优化检索算法、扩展知识库覆盖,打造更智能的编程助手。

ホーム - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.0. UTC+08:00, 2026-03-24 12:28
浙ICP备14020137号-1 $お客様$