话题AI工程 › AI Agent

AI工程:AI Agent

关联话题: 智能体、Multi-Agent、Agent、多Agent、多智能体、ai agents

AI Agent 是通过工程化的手段,为大语言模型提供了获取外部工具、知识的能力。他是介于人类、大语言模型之间的代理。当用户向 AI Agent 输入问题时,AI Agent 可以使用大语言模型作为推理引擎,将一个复杂的任务进行分解、给出任务执行规划。之后 Agent 会调用外部工具获取结果,并将大语言的上次推理和工具调用结果返回给大语言模型,让大语言模型继续思考、规划。如此循环,直到将一个复杂的任务完成。

从聊天窗口到多 Agent 控制台:一次 AI 编程协作范式的转移

随着AI编程占比提升,单Agent协作模式已显不足。作者探索多Agent并行工作,提出以Review为中心的协作范式,设计了Mexus工具,支持多Agent管理、观测与协调,强调结构化的spec定义与轻量claim机制,实现高效、可观测的多Agent编程环境,推动人与AI分工优化。

用 Claude Code 将三万行 Go 项目移植到 Rust:Agent Team 实践与 Harness 效率优化

用Rust重写Clash Meta内核,通过Claude Code的Agent Team机制实现高效协作。四个AI角色分工明确:架构师决策、项目经理排期、工程师编码、QA测试,配合文档驱动开发。关键经验包括:优化CLAUDE.md提升效率、里程碑边界重启Agent、精简Memory系统、严格测试验证。最终产出11个crate、3.1万行代码,验证了AI在大型工程项目的实用价值。

OpenClaw 落地到生产实际应用的一种可能的路径

Coding Agent跑得快,得益于代码世界的可视化、封闭性、可验证和可回滚特性。业务Agent难落地,因业务环境开放、分散且难撤销。要让Agent稳定执行,需重构业务环境:可视化任务、封闭工作单元、建立验证层和回滚机制。Amazon的沙盘实践证明,代理现实操作空间是关键。未来需将业务动作转化为可审阅产物,并前置高风险决策到沙盘推演。

OpenClaw Agent与Skill架构详解

OpenClaw 是一个强大的 AI Agent 框架,解决了多渠道消息处理、长时运行 Agent 和灵活知识扩展等痛点。它通过 Skill 机制动态注入领域知识,支持主子 Agent 并行执行任务,具备多层容错机制确保系统可靠性。OpenClaw 基于 pi-mono 扩展,提供生产级的多用户、多渠道支持,适用于复杂场景的 AI 应用。

一个问题变成 50 条 SQL:AI Agent 是怎么问数据库的?

AI Agent搞数据分析时,会疯狂生成大量SQL并发查询,传统数据库根本顶不住!StarRocks用三招搞定:①向量化引擎+资源隔离扛住机器级并发;②查询反馈机制自动优化AI生成的烂SQL;③语义视图+知识库确保查询结果符合业务口径。这波操作让AI既能撒欢查数据,又不会把系统搞崩或算错数~

OpenClaw的启示:身份权限管理是AI Agent时代的阿喀琉斯之踵

AI代理权限失控危机:OpenClaw等智能体被曝存在三大致命漏洞——过度权限导致系统风险、未认证实例暴露、远程代码执行漏洞。传统身份管理方案失效,专家提出新框架:身份传播切断越权链条、无密钥验证防止凭证泄露、上下文感知识别异常行为、意图感知拦截逻辑攻击。AWS和Azure已推出针对性解决方案,字节跳动也研发了双向认证体系,通过入站身份绑定和出站网关管控实现动态防护。(139字)

OpenClaw长期记忆:优秀管线与玄学效果

AI Agent的记忆系统面临稳定性挑战!OpenClaw采用Markdown文件存储记忆,依赖LLM自主决策写入和整理,存在遗漏风险。RDSClaw记忆插件通过实时结构化提取和语义整合补强,在LoCoMo10评测中准确率提升13.9%。双管线设计让AI既记住用户偏好,又能积累自身经验,实现跨会话的稳定记忆。

淘宝动效解决方案分享

淘宝推出了一套全链路动效解决方案,覆盖设计到播放全流程。通过AE插件实现动效检测优化,可视化编辑器支持动态元素调整,跨端播放器统一H5/Weex体验。方案创新性地解决了动效布局(align/group)、二进制压缩、代码生成等核心痛点,支持动态内容替换与AI辅助编辑,实现"一次制作多端复用"。该体系显著提升了动效生产效率与多端一致性,为业务提供了更智能可控的动效支持。

一文搞懂Hermes:新顶流Agent如何从经验中自我进化

Hermes Agent的Skills闭环系统让AI像人类专家一样积累经验,将成功操作提炼为可复用的技能文档。系统涵盖创建、索引、条件激活、渐进式加载、自改进等七阶段,通过原子写入、安全扫描等机制确保可靠性。设计上权衡了Prompt Cache与指令权重,实现低成本高效学习。这套程序性记忆模拟为AI Agent从"工具"迈向"伙伴"提供了关键架构参考。

【欢迎小龙虾加入】OpenClaw实战小结

OpenClaw将大模型、工具、工作流和外部系统串联,实现了从“聊天”到“做事”的跨越。本地部署适合快速试错,云端部署则适合稳定场景。OpenClaw在私人场景中作为“行动型入口”,简化任务流程;在团队场景中则充当AI员工,处理排查、编译、周报等重复性工作。养好OpenClaw关键在于扩充数据源、编写Skills,并通过对话不断调整优化。

Claude Code 源码拆解:从启动到多 Agent 扩展层

Claude Code通过分层设计,将复杂Agent系统的核心模块拆解为启动、REPL、Query Loop、Tool Runtime、Permission、Task和扩展层。每层专注解决特定问题,如启动层定边界,Query Loop处理连续运行,Tool Runtime制度化工具调用,Permission构建可解释执行链。系统复杂度被合理分配,确保Agent稳定扩展与运行。

Multi-agent coordination patterns: Five approaches and when to use them

多智能体系统有五种协作模式:生成-验证模式适用于质量关键型任务;协调-子代理模式适合明确分解的任务;代理团队模式处理独立长时任务;消息总线模式用于事件驱动场景;共享状态模式支持协作研究。选择模式需考虑任务结构、信息流和容错需求,建议从协调-子代理模式入手,按需演进。

Managing context in long-run agentic applications

在复杂的多代理系统中,保持代理间的协作和一致性是关键挑战。本文探讨了如何通过设计三种互补的上下文通道(Director的Journal、Critic的Review和Timeline)来管理长期运行的调查。Journal记录决策与观察,Review评估专家发现的可靠性,Timeline构建可信的事件序列,共同确保调查的连贯性和准确性。

Reducing Agentforce AI Debugging from Two Weeks to Same-Day with Query-Driven Observability

爱因斯坦笔记本平台通过Spark工作流,将AI调试时间从两周缩短至一天,支持超4亿条记录和800GB数据的实时查询。团队开发了统一工作流,实现生产数据的直接访问,解决了传统日志和指标的局限性。通过多租户隔离和高性能架构,确保安全的查询驱动调试,提升AI代理行为透明度和调试效率。

浏览器自动化:从GUI到OpenCLI

放弃前端UI自动化,解析底层API请求提升浏览器自动化效率。OpenCLI通过抓取网页背后的API,复现请求,避免点击按钮的不稳定性。支持多级认证策略,适配器生成与CLI集成,简化操作流程。未来软件竞争将转向API的可调用性,便于Agent理解与接入工作流。

立正请站好:一个组件复用 Skill 的工程化实践

开发组件复用Skill,旨在解决功能开发中组件重复创建问题。通过AGENTS.md、Hook和Skill三层结构,确保AI在编码前优先复用现有组件。核心设计包括统一入口、多因素加权匹配和可复用流水线索引构建,提升AI执行稳定性。实践表明,AI在清晰流程中表现更佳,减少即兴发挥,增强工程纪律。

首页 - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.1. UTC+08:00, 2026-04-16 09:22
浙ICP备14020137号-1 $访客地图$