AI工程:RAG
别再硬扛原生记忆了!OpenClaw内置Mem0,让Agent更省token、更智能
OpenClaw的记忆系统通过文件层和索引层实现跨会话、可回溯的记忆管理,支持Markdown文件和SQLite检索。原生记忆插件存在token消耗大、记忆不筛选等问题。openclaw-mem0-plugin插件引入Mem0,实现记忆精确检索和跨会话管理,安装简单,配置灵活,显著提升记忆效率,适合企业级应用。
让问题不过夜:交易领域“问诊”Agent实践
研发支持工作碎片化、重复性强,依赖个人经验,效率低且质量不稳定。为解决这一问题,我们构建了智能Agent系统,通过业务答疑和问题诊断两类核心能力,实现解释与排查工作的自动化前置。系统采用排查文档技能化和质量评分闭环机制,显著缩短响应时间,提升服务一致性与工程效能,推动研发支持的可规模化、可复用与可运营。
如何用 AI 做业务级 Code Review
代码评审中常面临Diff过多、新人不知历史Bug等问题。打造AI助手,从Git push触发,通过预处理Diff、语义重塑、RAG经验召回等步骤,深度Review并生成报告。实践中优化模型选型、长Diff处理及多Chunk整合,显著降低老事故复发率。未来将解决RAG噪音、一键采纳建议等问题,强化与Cursor及发布平台的集成,让AI成为懂业务的好搭档。
别再让语音机器人“答非所问”:AI Force任务型语音对话技术总结
AI语音助手要像真人一样完成任务,需解决“拟人化”和“专业化”两大难题。通过三段式架构,优化TTS、双工对话和ASR技术,提升语音交互的自然度和反应速度。自研“衍算”框架结合LLM,实现任务高效推进与专业应答,同时降低延迟和成本。未来将探索多Agent协同和泛服务场景适配,持续优化交互体验。
设计模式Trustworthy Generation:提升RAG信赖度
【RAG可信生成设计模式精要】针对检索增强生成(RAG)易出现的幻觉、偏见和信息缺失问题,提出"可解释、可追溯、可反思、可监管"四层解决方案。核心策略包括:设置相似度阈值过滤低关联内容、关键信息标注引用来源、引入自批判机制优化检索质量、构建全流程防护体系。需权衡系统复杂度与误过滤风险,可考虑双知识库交叉验证或置信分标注作为替代方案。(139字)
告别“伪智能”代码:用 Spec + RAG 打造真正懂你的AI程序员
AI Coding时代,代码质量提升的关键在于构建"Spec+RAG+MCP"三位一体的知识体系。Spec作为硬规则确保代码合规性,RAG动态检索非结构化知识补充上下文,MCP则标准化AI与外部服务的交互。通过分层协同,这套体系能显著提升生成代码的准确性、可维护性和业务贴合度,已在淘天集团部分业务线验证效果。未来将优化检索算法、扩展知识库覆盖,打造更智能的编程助手。
AI赋能售后测试:从“黑盒”到“智能伙伴”
这个智能助手解决了售后系统的三大痛点:逻辑混乱、数据构造繁琐和规则同步慢。它通过自动解析流程规则、提供标准化测试方案和实时业务查询,将黑盒变成透明工作台。基于Dify平台搭建,整合了知识库、实时数据和AI分析能力,支持多轮对话和复杂业务场景,比如售后单状态查询、数据构造指导和规则答疑,显著提升了协作效率和响应速度。
AgentScope 正式发布 Skills 支持 - 实现渐进式披露
在大语言模型驱动的Agent系统中,如何高效管理多能力是一个核心挑战。全量加载、多Agent架构和RAG方案各有局限,本质在于缺乏灵活的上下文加载机制。Skill机制通过渐进式披露,让Agent先知道“有什么能力”,需要时再调用完整知识,实现按需加载,保持逻辑连贯性,避免资源浪费和碎片化。AgentScope-Java进一步抽象Skill存储层,支持灵活部署和代码安全执行,为多领域知识密集型应用提供简单强大的解决方案。
TOS Vectors + TLS Trace:打造更高效、更智能的存储 SDK 工厂
火山引擎对象存储TOS面对多语言SDK维护的复杂性,引入AI Agent构建自动化生成流水线。通过AI理解业务语义,优化代码生成,提升维护效率。采用TOS Vector Bucket和日志服务TLS,实现低成本高效的知识存储与检索。评估与反思机制确保代码质量,动态观测助力系统优化。SDK Agent显著提升API及文档交付效率,大幅节省人力成本。
当设计师亲自下场训练AI:它开始先“看页面”,再写文案
这篇文章揭秘了如何用AI解决出海业务中的英文文案痛点。通过"图片理解+结构化解析"的创新设计,让AI能精准把握界面上下文;结合业务知识库的硬规则约束,确保文案符合专业规范;再经过30多次调优打磨,最终产出自然流畅的"人味儿"文案。这套产品化方案让设计师无需依赖专业文案,就能高效产出符合海外用户习惯的优质内容。
基于知识工程&JoyAgent双RAG的智能代码评审系统的探索与实践
双十一大促期间,代码评审面临时间紧、任务重的挑战。传统模式效率低,AI工具误报率高。京东物流团队探索双RAG架构,结合知识工程与JoyAgent知识库,提升评审效率与质量。通过识别项目类型、代码分块处理、RAG增强与重排序机制,系统能精准发现复杂代码缺陷,确保系统稳定性。未来将扩展至多模态代码理解与全域业务知识库构建。
自建一个 Agent 很难吗?一语道破,万语难明
我花一周时间为内部研发平台接入Agent开发能力,选用了Iframe嵌入方案,结合LangGraph和Next.js+React框架,优化了系统提示词和知识库建设,通过工具接入和上下文管理提升用户体验。压缩工具响应和上下文,确保Agent高效运行,解决复杂脚本处理中的注意力稀疏问题,实现连续对话和会话中断恢复。
Engineering VP Josh Clemm on how we use knowledge graphs, MCP, and DSPy in Dash
Dropbox Dash通过连接第三方应用构建统一搜索平台,利用知识图谱和多模态理解优化内容检索。采用索引检索而非联邦检索,提升效率和个性化结果。通过LLM作为裁判评估检索质量,结合DSPy优化提示词,提高准确性。知识图谱和索引架构的复杂性带来显著提升,但需投入大量基础设施和数据处理工作。
微信文本嵌入模型KaLM-Embedding登顶全球榜单:数据工程与训练技巧详解
微信团队开源KaLM-Embedding系列模型,包括中英双语的轻量版V2系列和登顶MTEB多语言榜首的Gemma3-12B-2511。该模型通过双向注意力机制、焦点式重加权等创新技术,显著提升语义检索精准度,支持RAG架构及搜索推荐等场景。开源工具链涵盖数据配方、训练管线及商业授权,实测在客服FAQ等工业场景表现优异,低参数量下性能媲美大模型。技术报告和模型已公开。
AI 实践:Code Insight 代码搜索定位的实践分享
代码索引技术助力高效代码搜索与导航,支撑IDE跳转、AI编码等场景。主流方案包括向量嵌入的RAG和基于AST的结构化索引,前者擅长语义理解,后者专注代码结构分析。RAG通过分块、嵌入、检索三步实现精准定位,AST结合符号表构建调用关系图谱。两者互补,提升代码问答、问题定位、测试用例生成等场景效率,推动AI编码工具从能用走向好用。
AI工程vs传统工程 —「道法术」中的变与不变
AI工程并非颠覆传统软件工程,而是在其基础上针对大模型不确定性进行架构升级。核心变化在于从追求绝对正确转向管理概率预期,延续分层解耦等原则,但建模重心转向上下文工程与不确定性边界控制。融合传统工程基本功与AI新工具,最终以确定性架构驾驭不确定性智能,实现可靠价值交付。