话题AI工程 › AI Agent

AI工程:AI Agent

关联话题: 智能体、Multi-Agent、Agent、多Agent、多智能体、ai agents

AI Agent 是通过工程化的手段,为大语言模型提供了获取外部工具、知识的能力。他是介于人类、大语言模型之间的代理。当用户向 AI Agent 输入问题时,AI Agent 可以使用大语言模型作为推理引擎,将一个复杂的任务进行分解、给出任务执行规划。之后 Agent 会调用外部工具获取结果,并将大语言的上次推理和工具调用结果返回给大语言模型,让大语言模型继续思考、规划。如此循环,直到将一个复杂的任务完成。

柚漫剧 AI全流程提效拆解---从单点提效到工程融合

柚漫剧团队通过AI赋能,打通“需求-设计-开发-测试”全链路智能闭环,构建Prompt友好型PRD、AI Coding基建等核心能力,实现产研模式从“人力驱动”向“AI驱动”的范式跃迁。AI辅助产品经理提效,设计师聚焦效果精修,研发实现设计即代码,测试升级为AI Agent,推动产研协作效率大幅提升。

Harness不是目的,知识才是护城河 —— 一个AI工程交付团队的知识沉淀实践

Harness Engineering热潮下,真正护城河是私域知识沉淀而非复杂工作流。知识分层架构(五层存储×五种类型×三级成熟度)让团队经验结构化,工作流成为知识载体。独立Git仓库实现跨项目共享,渐进式索引确保精准查询,自动衰减机制维持知识活性。突破人机交互瓶颈的远程操控让工作流7×24小时流转,形成"交付即沉淀"的复利循环。模型会迭代,领域知识永存。

淘天营销中后台生码工作流最佳实践

营销中后台AI生码提效路径升级,统一收敛至云端托管生码,解决本地研发环境不一致、AK管理难等问题。构建跨仓库工作区,打造可编排场景化工作流,覆盖需求理解至构建发布全链路。迁移重构采用架构文档+领域Skill固化规则,日常迭代引入功能树实现精准知识供给,形成提效飞轮。核心方法论:精确知识、工程逻辑、知识正向循环。

高德AI伴行:构建全模态出行智能体

高德推出AI伴行,打造全模态出行智能体!它能听懂你的语音、看懂周围环境,结合实时位置提供精准指引。无论是找方向、规划路线,还是景区导览、建筑讲解,AI伴行都能像贴心朋友一样陪你出行。融合视觉识别、时空感知和行动引擎,让导航更智能、更人性化。4月下旬起全国陆续上线,出门带上它,探索世界更轻松!

来自字节跳动TRAE的Harness Engineering指南

Harness Engineering 是一套驾驭AI智能体的工程框架,旨在通过约束和引导,确保AI系统稳定可靠地运行。它将AI视为“野马”,通过设计专业装备和训练协议,使其成为卓越执行者。Harness Engineering 不改变模型本身,而是优化其运行环境和机制,解决AI在生产中的可靠性、效率、安全性和可追踪性问题,推动AI从玩具阶段迈向生产级应用。

Improving Deep Agents with Harness Engineering

AI编码助手从Top 30飙到Top 5,全靠"缰绳"调得好!通过自动化追踪分析失败案例,用系统提示、工具和中间件三大杠杆优化执行流程。关键操作:让AI自我验证代码,强制测试环节;预装环境上下文减少搜索失误;用"思考三明治"策略分配算力(高-低-高推理强度)。核心逻辑是给AI搭好脚手架,帮它避开当前模型的短板,比如死循环改代码或忽略测试。开源项目实测显示,这套方法论能让AI编程更靠谱!

Agent Harness Engineering

编码代理的核心在于“模型+约束框架”,后者通过系统提示、工具链、沙盒等组件确保模型行为可控。每次错误都转化为框架规则,形成自我强化的闭环。优秀框架能让普通模型超越裸奔的顶级模型,关键在于针对性设计而非等待模型升级。未来趋势是框架动态化,像编译器一样按需组装工具和上下文。

800行代码实现 Open Claw 的 Tool、消息总线、子Agent管理架构

这个Agent框架基于Anthropic Claude API构建,核心包含工具系统、消息总线、子Agent管理和REPL主循环四大模块。工具系统采用薄抽象设计,直接对接SDK类型;消息总线实现双向通信隔离;子Agent通过Promise实现轻量级并发;REPL主循环采用互斥锁保证线程安全。整体架构简洁可控,强调工程确定性和可调试性,适合作为扩展AI能力的基础设施。

Build Agents that never forget

LLM本质无状态,记忆依赖每次请求重发对话历史,但构建真实代理时会出现上下文遗忘、个性化缺失等问题。记忆不仅是增加文本,而是结构化存储以便检索。认知科学将记忆分为感觉、工作、长期记忆,长期记忆又分情景、语义、程序性。Cognee结合向量搜索、知识图谱和关系存储,解决多跳查询难题,通过cognify和memify实现记忆自优化,使代理具备持久化、语义理解和关系推理能力。

深度解析 Hermes Agent 如何实现“自进化”及其 Prompt / Context / Harness 的设计实践

Hermes Agent凭借“持久运行”和“自进化”功能迅速走红,通过动态Skill生成和强化学习实现智能提升,解决了传统Agent无法自我学习的痛点。其兼容性强,支持多模型和平台,优化了上下文管理和记忆系统,提升了任务执行效率和稳定性。Hermes代表了AI从自主执行到自进化的重要跨越,推动了AGI发展。

从第一性原理思考 Agentic Engineering

AI时代下,软件工程正经历范式转变。Agentic Engineering提出人机深度协作新思路,通过结构化知识管理、全流程参与和精细验证机制,在保证质量的同时释放AI潜能。开源框架将方法论落地为可执行的Skill体系,实现工程经验的可复用与自进化。面对技术浪潮,工程师需聚焦问题本质与系统思维,在变局中把握不变的价值锚点。

深入源码:Hermes Agent 如何实现 "Self-Improving"

Hermes Agent凭借自进化能力崛起,OpenRouter排行榜增速达204%。它通过Memory记录用户偏好,Skill提炼操作经验,Nudge Engine定时复盘,形成闭环学习系统。相比OpenClaw的手写配置,Hermes能自动积累经验并优化执行流程,越用越高效。源码解析揭示三大子系统协同机制,安全设计确保进化可控。RDSHermes进一步降低使用门槛,让非开发者也能享受AI进化红利。

OpenAI Agents SDK:生产级智能体开发的工程化利器

OpenAI Agents SDK v0.14.2 推出智能体开发框架,解决现有智能体开发的三大困境,提供更强的控制层和原生沙箱执行能力,确保安全与隔离。SDK 接管底层循环与工具链,开发者只需专注业务逻辑,快速构建可靠、可扩展的智能体应用。

你写的 Skill,及格了吗?

本文提出了一套8维度的Skill量化评估框架,通过元数据质量、执行引导清晰度、领域知识密度等指标对Skill进行打分评级,解决了Skill质量难以客观衡量的问题。为提升评估可靠性,设计了多模型交叉验证流程,并适配不同AI工具环境提供四种执行策略。该框架既能帮助开发者识别改进短板,也能辅助用户横向对比选择优质Skill。

基于 Spring AI 从0到1构建 AI Agent

本文分享了一个基于Spring AI的AI Agent开发实践,通过生成代码来学习AI Agent开发。项目集成了RAG、Function Calling、MCP、SubAgent等核心模块,展示了从意图识别到工具调用的完整流程。AgentCore作为系统大脑,负责编排对话流程,ChatMemory管理对话记忆,Tool机制让LLM具备调用工具的能力。RAG模块通过多路召回和Rerank实现知识库检索,Command和Skill提供了两种Prompt模板机制,SubAgent支持独立记忆的任务执行。MCP协议实现了与外部服务的动态连接,扩展了Agent的能力边界。整个项目体现了AI Agent开发的工程化思路,Function Calling作为核心地基,支撑了多种复杂能力的实现。

Harness Engineering:AI 能在真正"出事会炸"的后端系统里写代码吗?

腾讯CDN团队探索AI在高风险后端系统的应用,通过Rust版Nonstop代理框架验证AI编码能力,并构建五层架构确保代码质量。面对复杂场景,团队采用多模型对抗审查和实时反馈机制,将效率提升20%。AI时代下,工程师角色转向设计约束规则,核心能力仍是抽象思维与问题预防。工程体系的持续进化比单次效率提升更重要。

首页 - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.2. UTC+08:00, 2026-04-28 08:53
浙ICP备14020137号-1 $访客地图$