知鸦日报2025-11-04

2025-11-03 16:30:00 ~ 2025-11-04 16:30:00

Tecnología

The Evolution from RAG to Agentic RAG to Agent Memory

摘要

AI智能体的记忆机制从基础的RAG逐步演化为代理式RAG,最终引入记忆管理概念。RAG通过外部知识源增强LLM的上下文,代理式RAG则让智能体动态决定是否检索及选择工具,而记忆机制进一步允许智能体读写信息,实现个性化交互。记忆管理涉及多种类型记忆源,并需应对记忆损坏和遗忘策略等新挑战。

G行应用韧性体系建设 ——全链路灰度发布技术应用

摘要

G行通过全链路灰度发布技术,解耦部署与发布流程,降低投产风险。该技术采用流量染色、策略管控、服务路由三位一体架构,实现资源与流量的双重隔离,确保灰度流量仅在灰度链路流转。通过标准化流程、立体化监控和敏捷化应急,G行构建了全场景、全周期的运维治理闭环,有效保障了业务连续性和系统稳定性。

七猫技术:AIOps 通用 Agent 探索(Simple)

摘要

本文探讨了基于ReAct框架开发AIOps通用Agent,旨在通过Prompt+LLM+Tools+Workspace的方式实现DevOps流程自动化。该Agent简化了Manus架构,支持用户通过提示词定义流程,快速集成AI能力。核心组件包括管理平台、Agent引擎和执行环境,采用Docker隔离运行环境,确保可靠性。实践表明,AIOps通用Agent在代码评审报告中表现优异,未来计划搭建管理平台,进一步提升功能和架构。

登录后可查看文章图片

不再搞Chain 设计的LangChain 1.0,与LangGraph有哪些区别?

摘要

LangChain 1.0 通过放弃 Chain 设计,引入标准化 ReAct 循环和 Middleware 机制,简化了 Agent 开发流程。新版本支持生产级控制,解决了上下文溢出、敏感信息泄露等问题,并统一了模型接入标准。结合 Milvus 向量数据库,LangChain 提供了高效的记忆系统,增强了 Agent 的长期记忆能力,使其更适用于复杂场景。

得物技术:大模型如何革新搜索相关性?智能升级让搜索更“懂你”

摘要

得物利用大模型技术优化搜索相关性,解决传统BERT模型标注成本高、迭代慢、泛化差的问题。通过二阶段流程和R1慢思考机制,大模型准确率提升至86.67%,中长尾场景表现显著改善。线上测试显示,badcase率下降5.39%,节约百万级标注成本。未来将探索生成式排序和logits蒸馏,持续提升搜索精准度。


‹ 2025-11-03 日报 2025-11-05 日报 ›

qrcode

关注公众号
接收推送