AI工程：RAG的相关资料

别再硬扛原生记忆了！OpenClaw内置Mem0，让Agent更省token、更智能

OpenClaw的记忆系统通过文件层和索引层实现跨会话、可回溯的记忆管理，支持Markdown文件和SQLite检索。原生记忆插件存在token消耗大、记忆不筛选等问题。openclaw-mem0-plugin插件引入Mem0，实现记忆精确检索和跨会话管理，安装简单，配置灵活，显著提升记忆效率，适合企业级应用。

字节跳动技术

让问题不过夜：交易领域“问诊”Agent实践

研发支持工作碎片化、重复性强，依赖个人经验，效率低且质量不稳定。为解决这一问题，我们构建了智能Agent系统，通过业务答疑和问题诊断两类核心能力，实现解释与排查工作的自动化前置。系统采用排查文档技能化和质量评分闭环机制，显著缩短响应时间，提升服务一致性与工程效能，推动研发支持的可规模化、可复用与可运营。

阿里巴巴技术

如何用 AI 做业务级 Code Review

代码评审中常面临Diff过多、新人不知历史Bug等问题。打造AI助手，从Git push触发，通过预处理Diff、语义重塑、RAG经验召回等步骤，深度Review并生成报告。实践中优化模型选型、长Diff处理及多Chunk整合，显著降低老事故复发率。未来将解决RAG噪音、一键采纳建议等问题，强化与Cursor及发布平台的集成，让AI成为懂业务的好搭档。

货拉拉技术

别再让语音机器人“答非所问”：AI Force任务型语音对话技术总结

AI语音助手要像真人一样完成任务，需解决“拟人化”和“专业化”两大难题。通过三段式架构，优化TTS、双工对话和ASR技术，提升语音交互的自然度和反应速度。自研“衍算”框架结合LLM，实现任务高效推进与专业应答，同时降低延迟和成本。未来将探索多Agent协同和泛服务场景适配，持续优化交互体验。

阿里巴巴技术

设计模式Trustworthy Generation：提升RAG信赖度

【RAG可信生成设计模式精要】针对检索增强生成（RAG）易出现的幻觉、偏见和信息缺失问题，提出"可解释、可追溯、可反思、可监管"四层解决方案。核心策略包括：设置相似度阈值过滤低关联内容、关键信息标注引用来源、引入自批判机制优化检索质量、构建全流程防护体系。需权衡系统复杂度与误过滤风险，可考虑双知识库交叉验证或置信分标注作为替代方案。（139字）

阿里巴巴技术

告别“伪智能”代码：用 Spec + RAG 打造真正懂你的AI程序员

AI Coding时代，代码质量提升的关键在于构建"Spec+RAG+MCP"三位一体的知识体系。Spec作为硬规则确保代码合规性，RAG动态检索非结构化知识补充上下文，MCP则标准化AI与外部服务的交互。通过分层协同，这套体系能显著提升生成代码的准确性、可维护性和业务贴合度，已在淘天集团部分业务线验证效果。未来将优化检索算法、扩展知识库覆盖，打造更智能的编程助手。

阿里巴巴技术

AI赋能售后测试：从“黑盒”到“智能伙伴”

这个智能助手解决了售后系统的三大痛点：逻辑混乱、数据构造繁琐和规则同步慢。它通过自动解析流程规则、提供标准化测试方案和实时业务查询，将黑盒变成透明工作台。基于Dify平台搭建，整合了知识库、实时数据和AI分析能力，支持多轮对话和复杂业务场景，比如售后单状态查询、数据构造指导和规则答疑，显著提升了协作效率和响应速度。

58同城技术

AgentScope 正式发布 Skills 支持 - 实现渐进式披露

在大语言模型驱动的Agent系统中，如何高效管理多能力是一个核心挑战。全量加载、多Agent架构和RAG方案各有局限，本质在于缺乏灵活的上下文加载机制。Skill机制通过渐进式披露，让Agent先知道“有什么能力”，需要时再调用完整知识，实现按需加载，保持逻辑连贯性，避免资源浪费和碎片化。AgentScope-Java进一步抽象Skill存储层，支持灵活部署和代码安全执行，为多领域知识密集型应用提供简单强大的解决方案。

阿里巴巴技术

TOS Vectors + TLS Trace：打造更高效、更智能的存储 SDK 工厂

火山引擎对象存储TOS面对多语言SDK维护的复杂性，引入AI Agent构建自动化生成流水线。通过AI理解业务语义，优化代码生成，提升维护效率。采用TOS Vector Bucket和日志服务TLS，实现低成本高效的知识存储与检索。评估与反思机制确保代码质量，动态观测助力系统优化。SDK Agent显著提升API及文档交付效率，大幅节省人力成本。

字节跳动技术

当设计师亲自下场训练AI：它开始先“看页面”，再写文案

这篇文章揭秘了如何用AI解决出海业务中的英文文案痛点。通过"图片理解+结构化解析"的创新设计，让AI能精准把握界面上下文；结合业务知识库的硬规则约束，确保文案符合专业规范；再经过30多次调优打磨，最终产出自然流畅的"人味儿"文案。这套产品化方案让设计师无需依赖专业文案，就能高效产出符合海外用户习惯的优质内容。

58同城产品

基于知识工程&JoyAgent双RAG的智能代码评审系统的探索与实践

双十一大促期间，代码评审面临时间紧、任务重的挑战。传统模式效率低，AI工具误报率高。京东物流团队探索双RAG架构，结合知识工程与JoyAgent知识库，提升评审效率与质量。通过识别项目类型、代码分块处理、RAG增强与重排序机制，系统能精准发现复杂代码缺陷，确保系统稳定性。未来将扩展至多模态代码理解与全域业务知识库构建。

京东技术

自建一个 Agent 很难吗？一语道破，万语难明

我花一周时间为内部研发平台接入Agent开发能力，选用了Iframe嵌入方案，结合LangGraph和Next.js+React框架，优化了系统提示词和知识库建设，通过工具接入和上下文管理提升用户体验。压缩工具响应和上下文，确保Agent高效运行，解决复杂脚本处理中的注意力稀疏问题，实现连续对话和会话中断恢复。

阿里巴巴技术

Engineering VP Josh Clemm on how we use knowledge graphs, MCP, and DSPy in Dash

Dropbox Dash通过连接第三方应用构建统一搜索平台，利用知识图谱和多模态理解优化内容检索。采用索引检索而非联邦检索，提升效率和个性化结果。通过LLM作为裁判评估检索质量，结合DSPy优化提示词，提高准确性。知识图谱和索引架构的复杂性带来显著提升，但需投入大量基础设施和数据处理工作。

dropbox技术

微信文本嵌入模型KaLM-Embedding登顶全球榜单：数据工程与训练技巧详解

微信团队开源KaLM-Embedding系列模型，包括中英双语的轻量版V2系列和登顶MTEB多语言榜首的Gemma3-12B-2511。该模型通过双向注意力机制、焦点式重加权等创新技术，显著提升语义检索精准度，支持RAG架构及搜索推荐等场景。开源工具链涵盖数据配方、训练管线及商业授权，实测在客服FAQ等工业场景表现优异，低参数量下性能媲美大模型。技术报告和模型已公开。

腾讯技术

AI 实践：Code Insight 代码搜索定位的实践分享

代码索引技术助力高效代码搜索与导航，支撑IDE跳转、AI编码等场景。主流方案包括向量嵌入的RAG和基于AST的结构化索引，前者擅长语义理解，后者专注代码结构分析。RAG通过分块、嵌入、检索三步实现精准定位，AST结合符号表构建调用关系图谱。两者互补，提升代码问答、问题定位、测试用例生成等场景效率，推动AI编码工具从能用走向好用。

有赞技术

AI工程vs传统工程 —「道法术」中的变与不变

AI工程并非颠覆传统软件工程，而是在其基础上针对大模型不确定性进行架构升级。核心变化在于从追求绝对正确转向管理概率预期，延续分层解耦等原则，但建模重心转向上下文工程与不确定性边界控制。融合传统工程基本功与AI新工具，最终以确定性架构驾驭不确定性智能，实现可靠价值交付。

阿里巴巴技术