话题 › AI工程 › AI Agent

AI工程：AI Agent

关联话题: 智能体、Multi-Agent、Agent、多Agent、多智能体、ai agents

AI Agent 是通过工程化的手段，为大语言模型提供了获取外部工具、知识的能力。他是介于人类、大语言模型之间的代理。当用户向 AI Agent 输入问题时，AI Agent 可以使用大语言模型作为推理引擎，将一个复杂的任务进行分解、给出任务执行规划。之后 Agent 会调用外部工具获取结果，并将大语言的上次推理和工具调用结果返回给大语言模型，让大语言模型继续思考、规划。如此循环，直到将一个复杂的任务完成。

面向智能导购的Agent评测实践

家居导购Agent评估新方法：用结构化多维Benchmark和LLM自动评分，准确率达91.9%。对比发现gpt51最优，较线上模型提升16.4%。核心瓶颈是识别已有家具、抓核心需求、避免推荐过度。这套自动化链路能高效追踪模型性能。

bili-fe-workflow —商业化智能开发工作流实践

本文提出从Prompt工程到Harness Engineering的演进，通过“.workflow”知识库和标准化工作流，将AI融入需求、开发、测试全链路。核心在于“模仿+拆解”，让AI在固定节点协作，将个人经验沉淀为团队能力，实现稳定提效。

AI伴行技术解析：基于空间智能的高可用Agent架构实践

高德伴行Agent通过双内核架构、ReAct推理引擎和时空上下文体系，将导航与开放问答解耦，实现低延迟、高可靠的动态决策。它把物理世界建模为可推理的时空状态，让用户能在行进中自然交互，获得真实可达的行动建议。

多轮 Agent 场景下，滴滴的 EAGLE-3 训推加速实践

在Agent长上下文场景中，EAGLE-3通过TTT训练和统一序列并行（USP）解决了长序列训练的显存瓶颈，实现128K上下文稳定训练。推理时，相比MTP方法，TPOT均值提升约2.4倍，P95尾部延迟降低35%-44%，显著提升多轮工具调用的推理效率。

从零设计生产级 Multi-Agent Harness：架构、评估、记忆、成本与 MCP 工具接入全拆解

Multi-Agent系统的生产落地，关键不在于模型强弱，而在于背后的运行时底座Harness。它像操作系统一样，统一编排、调度、控制状态、记忆、工具、成本和可观测性。Agent负责局部智能，Harness负责全局控制，这才是从Demo走向可靠生产力的核心。

AI 伴行技术解构：多模态感知与理解技术的深度实践

高德OmniVista Agent通过多模态感知与多Agent协作，让AI看懂真实世界。它能识别建筑、店铺或物品，自动完成查询、推荐与导航。你只需拍个照、随口一问，它就能理解场景并直接给出行动方案，彻底告别App间反复跳转的繁琐体验。

拆完Hermes源码，我发现Agent的"自我进化"根本不需要训练模型

Hermes Agent 通过“LLM 审判官”机制实现自我进化，核心是 Prompt Engineering 加文件持久化。它不修改模型权重，而是自动从经验中创建技能，让 Agent 越用越强。与 OpenClaw 的“全能但无状态”相比，它更像一个能积累经验的专属员工，适合长期个性化需求。

How Informatica Built a Multi-Agent AI System to Reduce Data Workflows from Months to Days

CLAIRE作为一个多代理AI系统，嵌入智能数据管理云（IDMC），旨在简化企业数据工作流程。传统流程涉及发现、治理、数据质量和管道编排等多个独立系统，耗时长达三个月。CLAIRE通过统一接口协调多代理执行，将复杂流程压缩至几天内完成。每个代理专注于特定任务，确保上下文准确性和工具选择的精确性。系统引入语义层和验证检查点，防止错误传播，确保执行可靠。CLAIRE的任务成功率达90%，显著提升企业数据管理效率。

salesforce技术

UI 自动化演进：从 Selenium / Appium 到 Skill + Playwright 自然语言驱动

UI自动化从Selenium时代到AI驱动，解决了定位脆弱、环境成本高等痛点。Skill+Playwright组合，通过自然语言与工程约束，简化用例编写与维护，提升多端适配效率。AI视觉与语义理解将进一步解放人工，实现全场景覆盖，推动UI自动化迈向智能化、高效化新阶段。

依托 Doubao-Seed-2.0-lite 打造“AI 电竞教练”的架构设计与工程落地

AI电竞教练框架通过多模态大模型，精准分析玩家操作，提供专业指导。传统教练的细分行为维度被拆解为多个Agent，每个Agent专注一个细节，输出结构化JSON数据。高级教练汇总数据，生成战术复盘报告。框架具备可扩展性，未来可应用于更多电竞项目，助力玩家技术提升。

Agent 时代的生产力悖论：当协作本身成为最大的瓶颈

AI时代需要重构研发协作模式。传统分工导致信息断层和效率瓶颈，AI Agent受限于人为划分的技术栈与碎片化文档。解决方案是"All in Code"：统一前后端代码库、结构化文档、自动化测试，构建自学习的Agent协作网络。关键在于让AI参与全流程决策，通过沙箱环境实现安全自治。研发模式正从"人主导"转向"Agent军团协同"，释放AI的端到端生产力。

用Agent评测思路管理AI Coding —— 31万行代码AI重构的实践

当AI生成90%代码时，系统走向取决于约束而非编码速度。我们通过Agent评测思路管理AI Coding：先团队共识再固化AI规则，让重构融入日常迭代。AI让"看全代码"不再稀缺，经验价值转向"判断优先级"。技术债被拆解为需求顺带动作，31万行代码在业务中悄然焕新。工程师角色从写代码转向设计AI工程环境，规范与协作成关键。

十年老技术开发的 AI Agent 探索之路

AI工具虽多，但手动管理AI终端效率低，上限仅4-6个并发。通过Bash脚本自动化80%的AI需求，避免过度依赖AI。构建24h无人值守的Agent系统，核心是文件轮询调度和SDD流程，确保任务可执行、可复盘。AI自修bug的前提是清晰的设计文档和架构约束。Agent开发正从框架之争转向协议和runtime之争，未来更像搭操作系统。Goal-Driven让系统自主推进，增强而非取代人力。

告别“氛围编程”：基于 Harness 治理和 SDD 的团队级 AI 研发范式演进与实践

AI编程出码率高达90%却提效不明显？揭秘"氛围编程"三大坑：自由发挥、效率陷阱和记忆丢失。高德团队提出SDD规范驱动和Harness驾驭工程双解法，将AI从黑盒变成可控工具。通过结构化知识库、精准需求拆解和专家团协作，实现从PRD到部署的全链路自动化。开发者角色升级为规范审核者，让AI在明确轨道上狂奔。未来瞄准智能Spec生成和强化Agent协作，开启研发新范式。

Harness Engineering：耗时一周，我是如何将应用的AI Coding率提升至90%的

AI编码正经历第三次范式跃迁，从Prompt Engineering到Context Engineering，再到Harness Engineering。Harness Engineering通过设计约束机制、反馈回路和工作流控制，解决了AI代码在企业级项目中的认知负担和质量控制问题。通过构建Harness体系，AI代码率从25%提升至90%，实现了高质量的可控输出。Harness的本质是外部化的质量保障体系，确保AI错误可控、可发现、可修复。未来，Harness将朝着自我进化、跨项目模板化和更精细的Agent角色矩阵方向发展。

基于 Harness + SDD + 多仓管理模式的 AI 全栈开发实践

AI全栈开发核心在于"Harness思维"：让AI模仿现有代码实现而非从零创造，确保风格统一与高复用率。搭建多仓工作区结合Codebase Indexing，实现前后端代码的语义关联与接口对齐。通过SDD文档驱动开发流程，明确技术方案与任务拆分，借助多Agent并行生成前后端代码。采用三阶段验证策略（Mock测试、后端构建、联调）提升效率，同时警惕SDD未明示的隐性功能。该方法可显著提升代码采纳率，降低50%+开发耗时。

AI工程：AI Agent的相关资料

AI工程：AI Agent