AI工程:AI Agent
AI Agent 是通过工程化的手段,为大语言模型提供了获取外部工具、知识的能力。他是介于人类、大语言模型之间的代理。当用户向 AI Agent 输入问题时,AI Agent 可以使用大语言模型作为推理引擎,将一个复杂的任务进行分解、给出任务执行规划。之后 Agent 会调用外部工具获取结果,并将大语言的上次推理和工具调用结果返回给大语言模型,让大语言模型继续思考、规划。如此循环,直到将一个复杂的任务完成。
Multi-agent coordination patterns: Five approaches and when to use them
多智能体系统有五种协作模式:生成-验证模式适用于质量关键型任务;协调-子代理模式适合明确分解的任务;代理团队模式处理独立长时任务;消息总线模式用于事件驱动场景;共享状态模式支持协作研究。选择模式需考虑任务结构、信息流和容错需求,建议从协调-子代理模式入手,按需演进。
Managing context in long-run agentic applications
在复杂的多代理系统中,保持代理间的协作和一致性是关键挑战。本文探讨了如何通过设计三种互补的上下文通道(Director的Journal、Critic的Review和Timeline)来管理长期运行的调查。Journal记录决策与观察,Review评估专家发现的可靠性,Timeline构建可信的事件序列,共同确保调查的连贯性和准确性。
Reducing Agentforce AI Debugging from Two Weeks to Same-Day with Query-Driven Observability
爱因斯坦笔记本平台通过Spark工作流,将AI调试时间从两周缩短至一天,支持超4亿条记录和800GB数据的实时查询。团队开发了统一工作流,实现生产数据的直接访问,解决了传统日志和指标的局限性。通过多租户隔离和高性能架构,确保安全的查询驱动调试,提升AI代理行为透明度和调试效率。
浏览器自动化:从GUI到OpenCLI
放弃前端UI自动化,解析底层API请求提升浏览器自动化效率。OpenCLI通过抓取网页背后的API,复现请求,避免点击按钮的不稳定性。支持多级认证策略,适配器生成与CLI集成,简化操作流程。未来软件竞争将转向API的可调用性,便于Agent理解与接入工作流。
立正请站好:一个组件复用 Skill 的工程化实践
开发组件复用Skill,旨在解决功能开发中组件重复创建问题。通过AGENTS.md、Hook和Skill三层结构,确保AI在编码前优先复用现有组件。核心设计包括统一入口、多因素加权匹配和可复用流水线索引构建,提升AI执行稳定性。实践表明,AI在清晰流程中表现更佳,减少即兴发挥,增强工程纪律。
用RAG的思路做agent知识管理,为什么跑不通
RAG系统在Agent知识管理中面临相似度高不等于正确的问题,跨页面答案和chunk拼合时表现不佳。VKFS通过在向量数据库上构建知识交互层,采用文件系统逻辑让Agent更自然地探索知识。VKFS支持目录浏览、文件读取和精准搜索,优化了知识获取流程,提升了Agent的灵活性和效率。
「快手 x 华为」实战干货:AI Coding 在鸿蒙研发中的落地实践
鸿蒙生态加速下,客户端研发面临三端并行挑战,"一码多端"需平衡差异与共享。"鸿图AI"项目将AI融入研发全链路,覆盖代码定位、需求理解与ArkTS生码,通过工程化约束解决代码偏移、理解失真等痛点。关键在让模型接触原始证据,强化验证闭环,推动AI从工具升级为研发体系的核心组件。
深度解析 OpenClaw 在 Prompt / Context / Harness 三个维度中的设计哲学与实践
OpenClaw作为AI Agent领域的标杆,其设计精髓在于三大维度:Prompt Engineering通过动态组装和Markdown驱动实现高效指令;Context Engineering借助Skills机制、压缩算法和双层记忆管理优化上下文;Harness Engineering则通过钩子、沙箱和约束机制确保可控性。这套架构为构建稳定、高效的Agent系统提供了可复用的方法论,值得深入学习和借鉴。
What's an Agent Harness? And how do I choose the best one?
AI代理的核心在于"模型+约束框架":模型提供智能,约束框架则赋予其状态管理、工具执行和长期记忆等能力。约束框架包含系统提示、工具集、沙箱环境、记忆管理等组件,决定了代理的实际表现。优秀的约束框架能让同一模型在基准测试中从30名开外跃居前5。设计约束框架需考虑执行环境、工具集、状态存储、长时任务处理等关键因素,这是将模型智能转化为可靠行动的关键所在。
You Don't Know LLM Training: Principles, Pipelines, and New Practices
2026年,大模型的能力差距不再仅依赖预训练,而是更多地体现在后训练阶段。预训练奠定基础,后训练通过指令微调、奖励设计、评估优化等环节,显著提升用户体验。数据配方、系统约束和训练管道设计是关键,模型的能力增强源于整个训练栈的协同优化,而非单一因素。
Better Harness: A Recipe for Harness Hill-Climbing with Evals
构建智能体的关键在于优化控制框架(harness),而评估数据(evals)是核心驱动力。通过人工标注、生产日志挖掘和外部数据集构建高质量评估集,并分类标记以针对性优化。系统采用"优化集+保留集"双轨验证,结合自动化调整与人工审核,避免过拟合。实验显示,该方法能显著提升智能体工具调用和多步推理能力,同时通过版本追踪防止性能回退。未来将探索自动化错误检测与修复,形成"使用-反馈-优化"的增强闭环。
自掏腰包一万元,拥抱AI这一年,我的工具、实践和思考
AI时代,如何高效拥抱技术变革?从工具链迭代到Agent实践,分享实用方法论:MAC工具链优化、低垂果实采摘、Prompt到Harness的工程演进。更提出让AI代学代用,构建知识管理闭环。技术浪潮中,与其追逐每个风口,不如专注可沉淀的实践。与AI做朋友,在动态平衡中找到自己的节奏。
【同事.skill】突然爆火之后,技术团队如何补上这门能力课
AI时代的知识沉淀新玩法!"同事.skill"项目爆火,10k+星标见证工作痕迹变AI技能包。离职不慌,你的代码风格、文档习惯都能被蒸馏成可调用Skill,实现"赛博永生"。前端团队已开搞:工程模板、接口规范、组件库一键生成,让经验从文档升级为团队基础设施。知识不再沉睡,直接进入工作流开挂!这波操作,把团队协作玩出了新高度~
零侵入、低成本!轻松为老系统注入 AI 灵魂
腾讯内部推出"Tenon Agent"解决方案,助力老旧业务系统快速接入AI能力。该方案通过三层架构实现:前端兼容各种老旧框架的JS包、后端标准化的Langgraph Agent框架、以及可复用Skills Hub生态。典型应用场景包括跨系统故障排查(效率提升15倍)、多语言配置自动化(操作步骤减少80%)等。方案采用榫卯理念,既解决历史系统改造难题,又为未来AGI生态预留接口,目前已落地10余个项目。
最近火爆的 Harness Engineering 到底是啥?
AI Agent在复杂任务中常遇稳定性问题,Harness Engineering应运而生,旨在确保模型稳定执行任务。其六层架构从上下文约束到错误恢复,全方位保障Agent稳定运行。AntV Skills项目实践展示Harness Engineering如何提升LLM生成图表代码的稳定性,显著提高成功率。Harness Engineering是AI从原型到产品升级的核心,决定AI能否在真实场景中稳定商用。