AI工程:AI Agent
AI Agent 是通过工程化的手段,为大语言模型提供了获取外部工具、知识的能力。他是介于人类、大语言模型之间的代理。当用户向 AI Agent 输入问题时,AI Agent 可以使用大语言模型作为推理引擎,将一个复杂的任务进行分解、给出任务执行规划。之后 Agent 会调用外部工具获取结果,并将大语言的上次推理和工具调用结果返回给大语言模型,让大语言模型继续思考、规划。如此循环,直到将一个复杂的任务完成。
OpenClaw长期记忆:优秀管线与玄学效果
AI Agent的记忆系统面临稳定性挑战!OpenClaw采用Markdown文件存储记忆,依赖LLM自主决策写入和整理,存在遗漏风险。RDSClaw记忆插件通过实时结构化提取和语义整合补强,在LoCoMo10评测中准确率提升13.9%。双管线设计让AI既记住用户偏好,又能积累自身经验,实现跨会话的稳定记忆。
淘宝动效解决方案分享
淘宝推出了一套全链路动效解决方案,覆盖设计到播放全流程。通过AE插件实现动效检测优化,可视化编辑器支持动态元素调整,跨端播放器统一H5/Weex体验。方案创新性地解决了动效布局(align/group)、二进制压缩、代码生成等核心痛点,支持动态内容替换与AI辅助编辑,实现"一次制作多端复用"。该体系显著提升了动效生产效率与多端一致性,为业务提供了更智能可控的动效支持。
一文搞懂Hermes:新顶流Agent如何从经验中自我进化
Hermes Agent的Skills闭环系统让AI像人类专家一样积累经验,将成功操作提炼为可复用的技能文档。系统涵盖创建、索引、条件激活、渐进式加载、自改进等七阶段,通过原子写入、安全扫描等机制确保可靠性。设计上权衡了Prompt Cache与指令权重,实现低成本高效学习。这套程序性记忆模拟为AI Agent从"工具"迈向"伙伴"提供了关键架构参考。
【欢迎小龙虾加入】OpenClaw实战小结
OpenClaw将大模型、工具、工作流和外部系统串联,实现了从“聊天”到“做事”的跨越。本地部署适合快速试错,云端部署则适合稳定场景。OpenClaw在私人场景中作为“行动型入口”,简化任务流程;在团队场景中则充当AI员工,处理排查、编译、周报等重复性工作。养好OpenClaw关键在于扩充数据源、编写Skills,并通过对话不断调整优化。
Claude Code 源码拆解:从启动到多 Agent 扩展层
Claude Code通过分层设计,将复杂Agent系统的核心模块拆解为启动、REPL、Query Loop、Tool Runtime、Permission、Task和扩展层。每层专注解决特定问题,如启动层定边界,Query Loop处理连续运行,Tool Runtime制度化工具调用,Permission构建可解释执行链。系统复杂度被合理分配,确保Agent稳定扩展与运行。
Multi-agent coordination patterns: Five approaches and when to use them
多智能体系统有五种协作模式:生成-验证模式适用于质量关键型任务;协调-子代理模式适合明确分解的任务;代理团队模式处理独立长时任务;消息总线模式用于事件驱动场景;共享状态模式支持协作研究。选择模式需考虑任务结构、信息流和容错需求,建议从协调-子代理模式入手,按需演进。
Managing context in long-run agentic applications
在复杂的多代理系统中,保持代理间的协作和一致性是关键挑战。本文探讨了如何通过设计三种互补的上下文通道(Director的Journal、Critic的Review和Timeline)来管理长期运行的调查。Journal记录决策与观察,Review评估专家发现的可靠性,Timeline构建可信的事件序列,共同确保调查的连贯性和准确性。
Reducing Agentforce AI Debugging from Two Weeks to Same-Day with Query-Driven Observability
爱因斯坦笔记本平台通过Spark工作流,将AI调试时间从两周缩短至一天,支持超4亿条记录和800GB数据的实时查询。团队开发了统一工作流,实现生产数据的直接访问,解决了传统日志和指标的局限性。通过多租户隔离和高性能架构,确保安全的查询驱动调试,提升AI代理行为透明度和调试效率。
浏览器自动化:从GUI到OpenCLI
放弃前端UI自动化,解析底层API请求提升浏览器自动化效率。OpenCLI通过抓取网页背后的API,复现请求,避免点击按钮的不稳定性。支持多级认证策略,适配器生成与CLI集成,简化操作流程。未来软件竞争将转向API的可调用性,便于Agent理解与接入工作流。
立正请站好:一个组件复用 Skill 的工程化实践
开发组件复用Skill,旨在解决功能开发中组件重复创建问题。通过AGENTS.md、Hook和Skill三层结构,确保AI在编码前优先复用现有组件。核心设计包括统一入口、多因素加权匹配和可复用流水线索引构建,提升AI执行稳定性。实践表明,AI在清晰流程中表现更佳,减少即兴发挥,增强工程纪律。
用RAG的思路做agent知识管理,为什么跑不通
RAG系统在Agent知识管理中面临相似度高不等于正确的问题,跨页面答案和chunk拼合时表现不佳。VKFS通过在向量数据库上构建知识交互层,采用文件系统逻辑让Agent更自然地探索知识。VKFS支持目录浏览、文件读取和精准搜索,优化了知识获取流程,提升了Agent的灵活性和效率。
「快手 x 华为」实战干货:AI Coding 在鸿蒙研发中的落地实践
鸿蒙生态加速下,客户端研发面临三端并行挑战,"一码多端"需平衡差异与共享。"鸿图AI"项目将AI融入研发全链路,覆盖代码定位、需求理解与ArkTS生码,通过工程化约束解决代码偏移、理解失真等痛点。关键在让模型接触原始证据,强化验证闭环,推动AI从工具升级为研发体系的核心组件。
深度解析 OpenClaw 在 Prompt / Context / Harness 三个维度中的设计哲学与实践
OpenClaw作为AI Agent领域的标杆,其设计精髓在于三大维度:Prompt Engineering通过动态组装和Markdown驱动实现高效指令;Context Engineering借助Skills机制、压缩算法和双层记忆管理优化上下文;Harness Engineering则通过钩子、沙箱和约束机制确保可控性。这套架构为构建稳定、高效的Agent系统提供了可复用的方法论,值得深入学习和借鉴。
What's an Agent Harness? And how do I choose the best one?
AI代理的核心在于"模型+约束框架":模型提供智能,约束框架则赋予其状态管理、工具执行和长期记忆等能力。约束框架包含系统提示、工具集、沙箱环境、记忆管理等组件,决定了代理的实际表现。优秀的约束框架能让同一模型在基准测试中从30名开外跃居前5。设计约束框架需考虑执行环境、工具集、状态存储、长时任务处理等关键因素,这是将模型智能转化为可靠行动的关键所在。
You Don't Know LLM Training: Principles, Pipelines, and New Practices
2026年,大模型的能力差距不再仅依赖预训练,而是更多地体现在后训练阶段。预训练奠定基础,后训练通过指令微调、奖励设计、评估优化等环节,显著提升用户体验。数据配方、系统约束和训练管道设计是关键,模型的能力增强源于整个训练栈的协同优化,而非单一因素。
Better Harness: A Recipe for Harness Hill-Climbing with Evals
构建智能体的关键在于优化控制框架(harness),而评估数据(evals)是核心驱动力。通过人工标注、生产日志挖掘和外部数据集构建高质量评估集,并分类标记以针对性优化。系统采用"优化集+保留集"双轨验证,结合自动化调整与人工审核,避免过拟合。实验显示,该方法能显著提升智能体工具调用和多步推理能力,同时通过版本追踪防止性能回退。未来将探索自动化错误检测与修复,形成"使用-反馈-优化"的增强闭环。