话题AI工程 › AI Agent

AI工程:AI Agent

关联话题: 智能体、Multi-Agent、Agent、多Agent、多智能体、ai agents

AI Agent 是通过工程化的手段,为大语言模型提供了获取外部工具、知识的能力。他是介于人类、大语言模型之间的代理。当用户向 AI Agent 输入问题时,AI Agent 可以使用大语言模型作为推理引擎,将一个复杂的任务进行分解、给出任务执行规划。之后 Agent 会调用外部工具获取结果,并将大语言的上次推理和工具调用结果返回给大语言模型,让大语言模型继续思考、规划。如此循环,直到将一个复杂的任务完成。

What's an Agent Harness? And how do I choose the best one?

AI代理的核心在于"模型+约束框架":模型提供智能,约束框架则赋予其状态管理、工具执行和长期记忆等能力。约束框架包含系统提示、工具集、沙箱环境、记忆管理等组件,决定了代理的实际表现。优秀的约束框架能让同一模型在基准测试中从30名开外跃居前5。设计约束框架需考虑执行环境、工具集、状态存储、长时任务处理等关键因素,这是将模型智能转化为可靠行动的关键所在。

You Don't Know LLM Training: Principles, Pipelines, and New Practices

2026年,大模型的能力差距不再仅依赖预训练,而是更多地体现在后训练阶段。预训练奠定基础,后训练通过指令微调、奖励设计、评估优化等环节,显著提升用户体验。数据配方、系统约束和训练管道设计是关键,模型的能力增强源于整个训练栈的协同优化,而非单一因素。

Better Harness: A Recipe for Harness Hill-Climbing with Evals

构建智能体的关键在于优化控制框架(harness),而评估数据(evals)是核心驱动力。通过人工标注、生产日志挖掘和外部数据集构建高质量评估集,并分类标记以针对性优化。系统采用"优化集+保留集"双轨验证,结合自动化调整与人工审核,避免过拟合。实验显示,该方法能显著提升智能体工具调用和多步推理能力,同时通过版本追踪防止性能回退。未来将探索自动化错误检测与修复,形成"使用-反馈-优化"的增强闭环。

自掏腰包一万元,拥抱AI这一年,我的工具、实践和思考

AI时代,如何高效拥抱技术变革?从工具链迭代到Agent实践,分享实用方法论:MAC工具链优化、低垂果实采摘、Prompt到Harness的工程演进。更提出让AI代学代用,构建知识管理闭环。技术浪潮中,与其追逐每个风口,不如专注可沉淀的实践。与AI做朋友,在动态平衡中找到自己的节奏。

【同事.skill】突然爆火之后,技术团队如何补上这门能力课

AI时代的知识沉淀新玩法!"同事.skill"项目爆火,10k+星标见证工作痕迹变AI技能包。离职不慌,你的代码风格、文档习惯都能被蒸馏成可调用Skill,实现"赛博永生"。前端团队已开搞:工程模板、接口规范、组件库一键生成,让经验从文档升级为团队基础设施。知识不再沉睡,直接进入工作流开挂!这波操作,把团队协作玩出了新高度~

零侵入、低成本!轻松为老系统注入 AI 灵魂

腾讯内部推出"Tenon Agent"解决方案,助力老旧业务系统快速接入AI能力。该方案通过三层架构实现:前端兼容各种老旧框架的JS包、后端标准化的Langgraph Agent框架、以及可复用Skills Hub生态。典型应用场景包括跨系统故障排查(效率提升15倍)、多语言配置自动化(操作步骤减少80%)等。方案采用榫卯理念,既解决历史系统改造难题,又为未来AGI生态预留接口,目前已落地10余个项目。

最近火爆的 Harness Engineering 到底是啥?

AI Agent在复杂任务中常遇稳定性问题,Harness Engineering应运而生,旨在确保模型稳定执行任务。其六层架构从上下文约束到错误恢复,全方位保障Agent稳定运行。AntV Skills项目实践展示Harness Engineering如何提升LLM生成图表代码的稳定性,显著提高成功率。Harness Engineering是AI从原型到产品升级的核心,决定AI能否在真实场景中稳定商用。

Scaling Managed Agents: Decoupling the brain from the hands

办公Agent的CI/CD时刻到来了

还记得手动部署代码的繁琐吗?AI办公正经历类似阶段,生成能力强,但输出到工作流仍需手动搬运。QClaw V2的Connector功能填补了这"最后一公里",将AI生成结果自动送达腾讯文档、邮箱等应用,减少了60%操作步骤。Multi-Agent则让AI角色各司其职,提升效率。AI办公的CI/CD时刻已至,人肉Jenkins时代结束了。

从 OpenClaw 看 Agent 架构设计

Agent架构设计的四大核心:上下文管理推荐任务隔离避免混杂,工具加载需平衡动态性与缓存效率,工具查找通过Skill聚合提升复用性,主循环设计可从对话驱动转向任务驱动增强可观测性。关键在于理解各方案的关联与取舍,没有标准答案,只有场景适配。

大模型如何重塑电商选品?

淘宝AI选品系统通过大模型技术,优化了传统低效的选品流程。系统能解析自然语言需求,结合行业趋势,生成高相关性选品集。采用DeepSearch和WideSearch算法提升信息检索广度,通过强化学习优化搜索词生成,确保选品质量。系统支持多轮对话调整,大幅缩短选品周期,提升品效。未来将探索直接优化选品集的Agentic RL方法。

Harness Engineering: 让 Coding Agent 可靠完成长程任务

长程任务在AI Coding中面临上下文耗尽、中断无法恢复和规模放大后行为不可控等挑战。通过任务拆解、并行执行、状态持久化和多层重试等设计,可以有效提升任务的效果、速度和成本控制。核心原则包括任务边界清晰、错误最小化解决、步骤间校验和允许局部失败,最终将这些经验沉淀为meta-skill,帮助Agent自主生成执行框架。

4亿token买来5个教训:让6个AI Agent连写4天代码发生了什么?

AI Agent团队开发踩坑实录:四天烧了4亿token换来的5条血泪教训。监控失效比没监控更危险,系统是"长"出来的而非设计出来的,问题总藏在最不怀疑的地方,工具数据需交叉验证,胶水代码比核心功能更重要。真正的稳定来自一次次故障后的修复,而非完美设计。

AI数据工程师在应用中如何"返璞归真"

AI Agent构建需超越轻量级模式,面对知识质量、语义理解与规模化维护挑战。应从Prompt-Centric转向Context-Aware,构建结构化、可推理的上下文语料体系,提升语义对齐与工具集成标准化。通过本体建设与RAG升级,实现精准理解、可靠推理与高效执行,降低系统性幻觉,提升AI决策的可解释性与业务价值。

Knowledge Wiki:面向 AI 的项目知识层建设实践

知识库通过结构化沉淀专家知识,降低人机协作的信息传递成本。采用渐进式披露,AI按层级获取精准信息,提升上下文利用效率。知识库与代码同步更新,确保知识新鲜度。实践表明,知识沉淀带来复利效应,AI建立业务认知更快,跨应用协作更高效。知识库从工具演变为研发基础设施,推动AI Coding效率持续提升。

「纯干货」几万字都讲不明白的Memory架构与思考

Memory是Agent长期交互中积累的知识库,核心在于将历史转化为决策依据。其本质包括Raw Ledger、Views和Policy三部分,形成一个闭环系统。非参数化Memory更易落地,但需逼近参数化方案的效果上限。时序记忆、技能固化与潜层融合是关键,确保记忆的可执行性、可治理性与可观测性,提升Agent的个性化与长程任务表现。

inicio - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.1. UTC+08:00, 2026-04-13 00:19
浙ICP备14020137号-1 $mapa de visitantes$