herramientas en línea

herramientas en línea

lista de clasificación

反馈

herramientas en línea

biblioteca biblioteca de código tienda

más

话题 › AI工程 › AI Agent

AI工程：AI Agent

关联话题: 智能体、Multi-Agent、Agent、多Agent、多智能体、ai agents

AI Agent 是通过工程化的手段，为大语言模型提供了获取外部工具、知识的能力。他是介于人类、大语言模型之间的代理。当用户向 AI Agent 输入问题时，AI Agent 可以使用大语言模型作为推理引擎，将一个复杂的任务进行分解、给出任务执行规划。之后 Agent 会调用外部工具获取结果，并将大语言的上次推理和工具调用结果返回给大语言模型，让大语言模型继续思考、规划。如此循环，直到将一个复杂的任务完成。

What's an Agent Harness? And how do I choose the best one?

AI代理的核心在于"模型+约束框架"：模型提供智能，约束框架则赋予其状态管理、工具执行和长期记忆等能力。约束框架包含系统提示、工具集、沙箱环境、记忆管理等组件，决定了代理的实际表现。优秀的约束框架能让同一模型在基准测试中从30名开外跃居前5。设计约束框架需考虑执行环境、工具集、状态存储、长时任务处理等关键因素，这是将模型智能转化为可靠行动的关键所在。

You Don't Know LLM Training: Principles, Pipelines, and New Practices

2026年，大模型的能力差距不再仅依赖预训练，而是更多地体现在后训练阶段。预训练奠定基础，后训练通过指令微调、奖励设计、评估优化等环节，显著提升用户体验。数据配方、系统约束和训练管道设计是关键，模型的能力增强源于整个训练栈的协同优化，而非单一因素。

Better Harness: A Recipe for Harness Hill-Climbing with Evals

构建智能体的关键在于优化控制框架（harness），而评估数据（evals）是核心驱动力。通过人工标注、生产日志挖掘和外部数据集构建高质量评估集，并分类标记以针对性优化。系统采用"优化集+保留集"双轨验证，结合自动化调整与人工审核，避免过拟合。实验显示，该方法能显著提升智能体工具调用和多步推理能力，同时通过版本追踪防止性能回退。未来将探索自动化错误检测与修复，形成"使用-反馈-优化"的增强闭环。

自掏腰包一万元，拥抱AI这一年，我的工具、实践和思考

AI时代，如何高效拥抱技术变革？从工具链迭代到Agent实践，分享实用方法论：MAC工具链优化、低垂果实采摘、Prompt到Harness的工程演进。更提出让AI代学代用，构建知识管理闭环。技术浪潮中，与其追逐每个风口，不如专注可沉淀的实践。与AI做朋友，在动态平衡中找到自己的节奏。

【同事.skill】突然爆火之后，技术团队如何补上这门能力课

AI时代的知识沉淀新玩法！"同事.skill"项目爆火，10k+星标见证工作痕迹变AI技能包。离职不慌，你的代码风格、文档习惯都能被蒸馏成可调用Skill，实现"赛博永生"。前端团队已开搞：工程模板、接口规范、组件库一键生成，让经验从文档升级为团队基础设施。知识不再沉睡，直接进入工作流开挂！这波操作，把团队协作玩出了新高度~

花椒技术

零侵入、低成本！轻松为老系统注入 AI 灵魂

腾讯内部推出"Tenon Agent"解决方案，助力老旧业务系统快速接入AI能力。该方案通过三层架构实现：前端兼容各种老旧框架的JS包、后端标准化的Langgraph Agent框架、以及可复用Skills Hub生态。典型应用场景包括跨系统故障排查（效率提升15倍）、多语言配置自动化（操作步骤减少80%）等。方案采用榫卯理念，既解决历史系统改造难题，又为未来AGI生态预留接口，目前已落地10余个项目。

最近火爆的 Harness Engineering 到底是啥？

AI Agent在复杂任务中常遇稳定性问题，Harness Engineering应运而生，旨在确保模型稳定执行任务。其六层架构从上下文约束到错误恢复，全方位保障Agent稳定运行。AntV Skills项目实践展示Harness Engineering如何提升LLM生成图表代码的稳定性，显著提高成功率。Harness Engineering是AI从原型到产品升级的核心，决定AI能否在真实场景中稳定商用。

Scaling Managed Agents: Decoupling the brain from the hands

办公Agent的CI/CD时刻到来了

还记得手动部署代码的繁琐吗？AI办公正经历类似阶段，生成能力强，但输出到工作流仍需手动搬运。QClaw V2的Connector功能填补了这"最后一公里"，将AI生成结果自动送达腾讯文档、邮箱等应用，减少了60%操作步骤。Multi-Agent则让AI角色各司其职，提升效率。AI办公的CI/CD时刻已至，人肉Jenkins时代结束了。

腾讯技术

从 OpenClaw 看 Agent 架构设计

Agent架构设计的四大核心：上下文管理推荐任务隔离避免混杂，工具加载需平衡动态性与缓存效率，工具查找通过Skill聚合提升复用性，主循环设计可从对话驱动转向任务驱动增强可观测性。关键在于理解各方案的关联与取舍，没有标准答案，只有场景适配。

大模型如何重塑电商选品？

淘宝AI选品系统通过大模型技术，优化了传统低效的选品流程。系统能解析自然语言需求，结合行业趋势，生成高相关性选品集。采用DeepSearch和WideSearch算法提升信息检索广度，通过强化学习优化搜索词生成，确保选品质量。系统支持多轮对话调整，大幅缩短选品周期，提升品效。未来将探索直接优化选品集的Agentic RL方法。

Harness Engineering: 让 Coding Agent 可靠完成长程任务

长程任务在AI Coding中面临上下文耗尽、中断无法恢复和规模放大后行为不可控等挑战。通过任务拆解、并行执行、状态持久化和多层重试等设计，可以有效提升任务的效果、速度和成本控制。核心原则包括任务边界清晰、错误最小化解决、步骤间校验和允许局部失败，最终将这些经验沉淀为meta-skill，帮助Agent自主生成执行框架。

4亿token买来5个教训：让6个AI Agent连写4天代码发生了什么？

AI Agent团队开发踩坑实录：四天烧了4亿token换来的5条血泪教训。监控失效比没监控更危险，系统是"长"出来的而非设计出来的，问题总藏在最不怀疑的地方，工具数据需交叉验证，胶水代码比核心功能更重要。真正的稳定来自一次次故障后的修复，而非完美设计。

AI数据工程师在应用中如何"返璞归真"

AI Agent构建需超越轻量级模式，面对知识质量、语义理解与规模化维护挑战。应从Prompt-Centric转向Context-Aware，构建结构化、可推理的上下文语料体系，提升语义对齐与工具集成标准化。通过本体建设与RAG升级，实现精准理解、可靠推理与高效执行，降低系统性幻觉，提升AI决策的可解释性与业务价值。

Knowledge Wiki：面向 AI 的项目知识层建设实践

知识库通过结构化沉淀专家知识，降低人机协作的信息传递成本。采用渐进式披露，AI按层级获取精准信息，提升上下文利用效率。知识库与代码同步更新，确保知识新鲜度。实践表明，知识沉淀带来复利效应，AI建立业务认知更快，跨应用协作更高效。知识库从工具演变为研发基础设施，推动AI Coding效率持续提升。

「纯干货」几万字都讲不明白的Memory架构与思考

Memory是Agent长期交互中积累的知识库，核心在于将历史转化为决策依据。其本质包括Raw Ledger、Views和Policy三部分，形成一个闭环系统。非参数化Memory更易落地，但需逼近参数化方案的效果上限。时序记忆、技能固化与潜层融合是关键，确保记忆的可执行性、可治理性与可观测性，提升Agent的个性化与长程任务表现。

«
1
2
3
4
5
6
7
8
9
10
...
30
31
»

inicio - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.1. UTC+08:00, 2026-04-13 00:19
浙ICP备14020137号-1 $mapa de visitantes$