话题AI工程 › AI Agent

AI工程:AI Agent

关联话题: 智能体、Multi-Agent、Agent、多Agent、多智能体、ai agents

AI Agent 是通过工程化的手段,为大语言模型提供了获取外部工具、知识的能力。他是介于人类、大语言模型之间的代理。当用户向 AI Agent 输入问题时,AI Agent 可以使用大语言模型作为推理引擎,将一个复杂的任务进行分解、给出任务执行规划。之后 Agent 会调用外部工具获取结果,并将大语言的上次推理和工具调用结果返回给大语言模型,让大语言模型继续思考、规划。如此循环,直到将一个复杂的任务完成。

立正请站好:一个组件复用 Skill 的工程化实践

开发组件复用Skill,旨在解决功能开发中组件重复创建问题。通过AGENTS.md、Hook和Skill三层结构,确保AI在编码前优先复用现有组件。核心设计包括统一入口、多因素加权匹配和可复用流水线索引构建,提升AI执行稳定性。实践表明,AI在清晰流程中表现更佳,减少即兴发挥,增强工程纪律。

用RAG的思路做agent知识管理,为什么跑不通

RAG系统在Agent知识管理中面临相似度高不等于正确的问题,跨页面答案和chunk拼合时表现不佳。VKFS通过在向量数据库上构建知识交互层,采用文件系统逻辑让Agent更自然地探索知识。VKFS支持目录浏览、文件读取和精准搜索,优化了知识获取流程,提升了Agent的灵活性和效率。

「快手 x 华为」实战干货:AI Coding 在鸿蒙研发中的落地实践

鸿蒙生态加速下,客户端研发面临三端并行挑战,"一码多端"需平衡差异与共享。"鸿图AI"项目将AI融入研发全链路,覆盖代码定位、需求理解与ArkTS生码,通过工程化约束解决代码偏移、理解失真等痛点。关键在让模型接触原始证据,强化验证闭环,推动AI从工具升级为研发体系的核心组件。

深度解析 OpenClaw 在 Prompt / Context / Harness 三个维度中的设计哲学与实践

OpenClaw作为AI Agent领域的标杆,其设计精髓在于三大维度:Prompt Engineering通过动态组装和Markdown驱动实现高效指令;Context Engineering借助Skills机制、压缩算法和双层记忆管理优化上下文;Harness Engineering则通过钩子、沙箱和约束机制确保可控性。这套架构为构建稳定、高效的Agent系统提供了可复用的方法论,值得深入学习和借鉴。

What's an Agent Harness? And how do I choose the best one?

AI代理的核心在于"模型+约束框架":模型提供智能,约束框架则赋予其状态管理、工具执行和长期记忆等能力。约束框架包含系统提示、工具集、沙箱环境、记忆管理等组件,决定了代理的实际表现。优秀的约束框架能让同一模型在基准测试中从30名开外跃居前5。设计约束框架需考虑执行环境、工具集、状态存储、长时任务处理等关键因素,这是将模型智能转化为可靠行动的关键所在。

You Don't Know LLM Training: Principles, Pipelines, and New Practices

2026年,大模型的能力差距不再仅依赖预训练,而是更多地体现在后训练阶段。预训练奠定基础,后训练通过指令微调、奖励设计、评估优化等环节,显著提升用户体验。数据配方、系统约束和训练管道设计是关键,模型的能力增强源于整个训练栈的协同优化,而非单一因素。

Better Harness: A Recipe for Harness Hill-Climbing with Evals

构建智能体的关键在于优化控制框架(harness),而评估数据(evals)是核心驱动力。通过人工标注、生产日志挖掘和外部数据集构建高质量评估集,并分类标记以针对性优化。系统采用"优化集+保留集"双轨验证,结合自动化调整与人工审核,避免过拟合。实验显示,该方法能显著提升智能体工具调用和多步推理能力,同时通过版本追踪防止性能回退。未来将探索自动化错误检测与修复,形成"使用-反馈-优化"的增强闭环。

自掏腰包一万元,拥抱AI这一年,我的工具、实践和思考

AI时代,如何高效拥抱技术变革?从工具链迭代到Agent实践,分享实用方法论:MAC工具链优化、低垂果实采摘、Prompt到Harness的工程演进。更提出让AI代学代用,构建知识管理闭环。技术浪潮中,与其追逐每个风口,不如专注可沉淀的实践。与AI做朋友,在动态平衡中找到自己的节奏。

【同事.skill】突然爆火之后,技术团队如何补上这门能力课

AI时代的知识沉淀新玩法!"同事.skill"项目爆火,10k+星标见证工作痕迹变AI技能包。离职不慌,你的代码风格、文档习惯都能被蒸馏成可调用Skill,实现"赛博永生"。前端团队已开搞:工程模板、接口规范、组件库一键生成,让经验从文档升级为团队基础设施。知识不再沉睡,直接进入工作流开挂!这波操作,把团队协作玩出了新高度~

零侵入、低成本!轻松为老系统注入 AI 灵魂

腾讯内部推出"Tenon Agent"解决方案,助力老旧业务系统快速接入AI能力。该方案通过三层架构实现:前端兼容各种老旧框架的JS包、后端标准化的Langgraph Agent框架、以及可复用Skills Hub生态。典型应用场景包括跨系统故障排查(效率提升15倍)、多语言配置自动化(操作步骤减少80%)等。方案采用榫卯理念,既解决历史系统改造难题,又为未来AGI生态预留接口,目前已落地10余个项目。

最近火爆的 Harness Engineering 到底是啥?

AI Agent在复杂任务中常遇稳定性问题,Harness Engineering应运而生,旨在确保模型稳定执行任务。其六层架构从上下文约束到错误恢复,全方位保障Agent稳定运行。AntV Skills项目实践展示Harness Engineering如何提升LLM生成图表代码的稳定性,显著提高成功率。Harness Engineering是AI从原型到产品升级的核心,决定AI能否在真实场景中稳定商用。

Scaling Managed Agents: Decoupling the brain from the hands

办公Agent的CI/CD时刻到来了

还记得手动部署代码的繁琐吗?AI办公正经历类似阶段,生成能力强,但输出到工作流仍需手动搬运。QClaw V2的Connector功能填补了这"最后一公里",将AI生成结果自动送达腾讯文档、邮箱等应用,减少了60%操作步骤。Multi-Agent则让AI角色各司其职,提升效率。AI办公的CI/CD时刻已至,人肉Jenkins时代结束了。

从 OpenClaw 看 Agent 架构设计

Agent架构设计的四大核心:上下文管理推荐任务隔离避免混杂,工具加载需平衡动态性与缓存效率,工具查找通过Skill聚合提升复用性,主循环设计可从对话驱动转向任务驱动增强可观测性。关键在于理解各方案的关联与取舍,没有标准答案,只有场景适配。

大模型如何重塑电商选品?

淘宝AI选品系统通过大模型技术,优化了传统低效的选品流程。系统能解析自然语言需求,结合行业趋势,生成高相关性选品集。采用DeepSearch和WideSearch算法提升信息检索广度,通过强化学习优化搜索词生成,确保选品质量。系统支持多轮对话调整,大幅缩短选品周期,提升品效。未来将探索直接优化选品集的Agentic RL方法。

Harness Engineering: 让 Coding Agent 可靠完成长程任务

长程任务在AI Coding中面临上下文耗尽、中断无法恢复和规模放大后行为不可控等挑战。通过任务拆解、并行执行、状态持久化和多层重试等设计,可以有效提升任务的效果、速度和成本控制。核心原则包括任务边界清晰、错误最小化解决、步骤间校验和允许局部失败,最终将这些经验沉淀为meta-skill,帮助Agent自主生成执行框架。

Accueil - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.1. UTC+08:00, 2026-04-14 05:53
浙ICP备14020137号-1 $Carte des visiteurs$