话题AI工程 › AI Agent

AI工程:AI Agent

关联话题: 智能体、Multi-Agent、Agent、多Agent、多智能体、ai agents

AI Agent 是通过工程化的手段,为大语言模型提供了获取外部工具、知识的能力。他是介于人类、大语言模型之间的代理。当用户向 AI Agent 输入问题时,AI Agent 可以使用大语言模型作为推理引擎,将一个复杂的任务进行分解、给出任务执行规划。之后 Agent 会调用外部工具获取结果,并将大语言的上次推理和工具调用结果返回给大语言模型,让大语言模型继续思考、规划。如此循环,直到将一个复杂的任务完成。

用代码"驯服" LLM:AutoHarness 如何让小模型打败大模型

Google DeepMind推出AutoHarness,让LLM自动生成Python代码约束自身输出,在145个文字游戏中实现100%合法动作率。通过固定函数签名和树搜索策略,AutoHarness显著提升LLM在任务中的表现,尤其在单人游戏中,纯代码策略以零推理成本超越GPT-5.2-High。这一创新为解决LLM输出合法性提供了高效自动化方案。

The Anatomy of an Agent Harness

模型是大脑,而“缰绳”(Harness)则是让AI真正干活的系统框架。它通过文件存储、代码执行、沙箱环境等组件,帮模型突破原生限制——比如持久化记忆、实时获取知识、自主解决问题。随着模型进化,部分功能可能内化,但系统级设计仍关键。当前研究正探索多代理协作、自修复机制等前沿方向,让AI更高效可靠。

Harness Engineering Is Cybernetics

AI时代工程模式的进化:从手动操作到"驾驭工程"。就像瓦特蒸汽机的离心调速器取代人工调节,Kubernetes通过声明式配置管理集群,如今工程师不再手写代码,而是设计环境、构建反馈循环,让AI代理完成编码。关键在于将人类判断转化为机器可读的规范——架构文档、定制检查器、黄金原则。传统工程实践的价值被重新放大,忽视文档和测试的代价从缓慢累积变成即时爆发。未来工程师的核心能力不是编写代码,而是定义"正确"的标准并校准系统。

你不知道的 Agent:原理、架构与工程实践

Agent架构的核心在于稳定的控制流和上下文管理,通过工具扩展、提示结构调整和状态外化实现新能力。Harness系统比模型本身更决定系统收敛,高质量验证和清晰目标不可或缺。上下文工程防Context Rot,分层管理信息和记忆,确保信号质量。工具设计遵循ACI原则,边界明确,参数防错。记忆分层管理,跨会话一致性关键。长任务靠状态外化,多Agent先有任务图和隔离再并行。评测系统出问题先修评测,Trace是排查前提。

From firefighting to building: How AI agents restored our team’s core productivity

Grab的ADW团队开发了多代理AI系统,自动处理数据查询和代码修改请求,显著提升了工作效率。该系统通过FastAPI、LangGraph等技术栈,实现复杂任务的分工协作,减少工程师的重复劳动。Agent模块化设计优于单一AI,提高了维护性和准确性。系统部署后,处理时间大幅缩短,团队生产力显著提升,从被动支持转向高价值工作。

OpenViking 实战教程:搭建多仓库代码语义检索系统,赋能 AI 助手 & OpenClaw 记忆插件 2.0 升级

多仓库代码问答常因上下文缺失、语义检索低效而困难。OpenViking通过聚合多仓库代码、构建语义索引,显著提升AI助手的跨仓库检索能力。实测显示,集成OpenViking后问答准确率从40%提升至90%,同时降低30%的Token成本。安装只需pip install openviking,支持本地或GitHub仓库导入,还能与飞书等聊天工具深度集成,让开发者轻松实现智能代码问答。

企业级 Agent 多智能体架构与选型指南 -- 来自1000+行业应用实践积累

AgentScope框架支持多种多智能体模式,如Pipeline、Routing、Skills等,适用于不同业务场景。开发者可基于ReActAgent单智能体优先原则,逐步演进至多智能体架构。Spring AI Alibaba与AgentScope协同,提供Graph编排能力,支持工作流式与对话式多智能体混合编排,提升开发效率与系统可靠性。

打破“知识孤岛”:微服务架构下的自动化业务图谱构建

微服务架构下,业务知识分散、配置变更风险高、协作效率低等问题愈发突出。通过自动化业务知识图谱,实现了前后端代码分析、知识图谱建模和多源数据融合,构建了智能影响分析、业务知识问答和页面级灰度管理等核心应用场景,显著提升了业务理解和运维效率。技术挑战中,前端扫描自适应架构、后端配置三重识别机制和多源数据一致性保障是关键突破。未来将持续优化图谱数据、探索AI应用和增强可视化。

Review the spec, not the code

AI生成代码正颠覆传统开发流程,PR数量激增但有效审查率暴跌。旧式逐行审阅模式在AI时代已失效,70%的AI代码因不被信任遭拒。关键在于转变思路:从审查代码转向前置验证需求文档,用类型检查、自动化测试、自定义规则等多层防护网替代人工检查。真正的风险往往藏在未被明确记录的架构决策中,而非代码细节。团队需重构流程,将质量关卡前移至需求设计阶段,用机器可验证的规范约束AI输出,释放工程师精力聚焦核心设计问题。

深入理解OpenClaw技术架构与实现原理(上)

OpenClaw是一款高效的个人AI助手,其技术架构以本地优先为核心,具备高度灵活性和扩展性。核心组件包括Gateway网关、Pi Agent智能体运行时、Channels频道连接生态、Nodes设备节点与伴侣应用等。OpenClaw通过AI-Coding实现软件开发范式的革新,提供了统一控制平面、智能体循环、定时任务系统、工具系统等模块,支持多频道集成、跨设备硬件控制、安全沙箱机制等功能,展现了强大的个人助手能力。

从架构到代码:深入理解 OpenClaw 的双源记忆系统

OpenClaw通过分层记忆系统,解决了AI助手在多平台交互中的记忆统一问题。它将记忆从上下文中剥离,构建了持久化、可搜索的知识库,支持动态和静态记忆的双源存储。动态记忆自动记录会话,静态记忆则提炼关键信息。记忆检索采用混合搜索策略,结合向量和关键词,确保信息高效调用。这一设计使OpenClaw能够长期积累用户偏好,实现从工具到伙伴的进化。

Ranking Engineer Agent (REA): The Autonomous AI Agent Accelerating Meta’s Ads Ranking Innovation

Meta推出自主AI代理REA,革新广告排名模型的机器学习生命周期。REA自主生成假设、启动训练任务、调试失败并迭代结果,显著提升模型准确度和工程效率。通过休眠唤醒机制,REA管理跨天乃至跨周的异步工作流,减少人工干预,实现高效持续操作。REA结合历史数据和前沿研究,生成高质量假设,并在计算预算内灵活应对现实约束。其首次生产验证中,模型准确度翻倍,工程产出提升五倍,为ML工程带来新范式。

被 Karpathy 下场推荐的 NanoClaw 是什么来头

OpenClaw一夜爆红,成为GitHub最受欢迎开源项目,其IM远程操控电脑的AI助手形态满足了大众对Jarvis的幻想。NanoClaw则以其小巧易懂、容器隔离安全的特点,被Karpathy推荐。两者各有优势,OpenClaw功能全面但安装复杂,NanoClaw安装简便且安全,但生态尚不完善。Claws项目虽前景广阔,但技术护城河浅,未来面临激烈竞争。

AI Coding前端实践后的复盘总结

AI Coding在前端开发中展现显著效率,尤其在样板代码生成和UI组件搭建上。然而,复杂业务逻辑和样式细节仍需人工干预。通过优化提示词、建立知识库和严格代码审查,团队提炼出“人机协同”最佳工作流,提升研发速度与质量。AI Coding工具虽便捷,但依赖高质量Prompt和知识库,未来需加强AI驱动的代码审查体系建设,确保智能化开发的可持续性。

我给 OpenClaw 杀了 47 次僵尸进程,终于想明白了一些事

OpenClaw虽火但坑多,Gateway单点故障频发,钉钉集成体验割裂。其成功在于将"万能AI助理"概念具象化,30万Star背后是技术叙事的力量。本地模式自由但风险自担,云端方案省心却受限。Skill模式颠覆传统工程,但架构决策仍需人力。AI写代码易,做产品难,测试覆盖救不了体验短板。未来已来一半,既别神话也别抵抗,赶紧上手才是真。

兄弟!你真的懂 Skill 吗?

Anthropic的Skill系统通过SKILL.md和skill_run沙箱实现AI能力的灵活调用,而非依赖function calling。系统支持五种执行模式:纯Prompt注入、脚本执行、库调用、参考文档渐进加载和编排型。SKILL.md作为核心,既是使用手册也是知识传递工具,LLM通过阅读SKILL.md自主决定执行方式。skill_run则提供安全隔离的执行环境,支持多种语言和命令,极大提升了AI的任务处理能力。

inicio - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.0. UTC+08:00, 2026-03-22 19:31
浙ICP备14020137号-1 $mapa de visitantes$