话题AI工程 › AI Agent

AI工程:AI Agent

关联话题: 智能体、Multi-Agent、Agent、多Agent、多智能体、ai agents

AI Agent 是通过工程化的手段,为大语言模型提供了获取外部工具、知识的能力。他是介于人类、大语言模型之间的代理。当用户向 AI Agent 输入问题时,AI Agent 可以使用大语言模型作为推理引擎,将一个复杂的任务进行分解、给出任务执行规划。之后 Agent 会调用外部工具获取结果,并将大语言的上次推理和工具调用结果返回给大语言模型,让大语言模型继续思考、规划。如此循环,直到将一个复杂的任务完成。

治愈 Cursor AI 编程的 “幻觉”?用它就够了!

AI编码工具正从"对话式"向"契约式"演进。天玑团队打造的Specflow方案,通过Specify-Plan-Implement-Archive四阶段流程,将模糊需求转化为机器可执行的精准指令。这套系统强制需求对齐、技术建模和原子化开发,用物理门控杜绝"带病编码",实现全链路质量管控。未来将向自治架构进化,让AI真正成为懂业务的编码伙伴。研发范式正从"写代码"转向"定义问题"。

Claude Code auto mode: a safer way to skip permissions

Claude Code的自动模式通过双层防御机制提升安全性:输入层使用提示注入探测,输出层采用转录分类器。分类器分两阶段工作,快速过滤后再进行链式思考,降低误报率。该模式旨在减少手动批准疲劳,同时防止过度活跃行为和提示注入等威胁。尽管存在17%的误放率,但相较无权限检查的模式,安全性显著提升。自动模式适用于低风险任务,但不替代高安全性场景下的手动审查。

零废话!一文讲透从0构建AI Agent

AI Agent开发的核心在于LLM、工具调用与循环协作。大语言模型(LLM)通过API提供智能基础,上下文管理维持对话记忆,工具调用赋予执行能力。构建分四阶段递进:单次对话→多轮交互→工具调用→自主循环(ReAct)。进阶架构通过MCP协议标准化工具对接,Sub-Agent分工处理复杂任务,Skill封装固定流程。关键在于平衡上下文限制与任务需求,用结构化工具提升可靠性。

深入理解OpenClaw技术架构与实现原理(下)

OpenClaw技术架构从沙箱隔离到企业智能体演进,展现了分布式、安全可控的发展方向。沙箱系统提供多层次隔离,记忆管理采用Markdown文件与SQLite索引相结合,确保数据私有与高效检索。多代理路由策略实现灵活的任务分配,Nodes架构支持远程设备管理。未来企业智能体将深度融合业务流程,构建多智能体协作网络,推动数字化转型。

讲透Claude Code架构一篇就够:上下文、治理与工程实践

Claude Code的六层模型揭示其运转机制,上下文管理是关键。CLAUDE.md需简洁,避免污染上下文。工具设计应优化正确选择和使用,Skills提供按需加载的工作流。Subagent用于隔离执行,Hooks确保确定性流程。验证层级确保任务正确完成。Prompt Caching降低成本,提升延迟。工程实践中,收敛状态再暴露编辑入口,避免不必要的混乱。

Agentic Search for Context Engineering

上下文工程的核心在于代理搜索,占比高达80%。现代代理不再被动接收上下文,而是主动构建。搜索工具是其关键手段,包括文件系统、数据库和命令行工具等。了解不同搜索工具的工作原理及其优劣,有助于为代理选择最合适的搜索接口。通过学习,掌握如何为代理定制搜索工具,提升实际应用效果。

Harness design for long-running application development

探索AI在多领域应用的潜力,通过设计生成器与评估器的多代理架构,提升Claude在前端设计和全栈开发中的表现。评估器基于具体标准反馈,生成器迭代优化,实现高质量输出。模型自主编码时,采用任务分解和上下文重置策略,确保连贯性。实验证明,分离生成与评估流程能显著提升应用质量和创意表达。

从心理按摩到实操上手的OpenClaw全指南

OpenClaw是一个AI Agent平台,能操作电脑、处理文件、跑任务。它不包含AI模型,需搭配"大脑"使用。核心包括Gateway、Channel、Agent等。安装需Node.js 22+,支持macOS/Windows。费用高,token消耗大,建议订阅模式。多Agent协作可实现复杂任务,需注意安全和配置优化。开源案例丰富,未来或适配更多办公工具。

观察 AIRI 源码:一个 Agent 系统如何处理入口、扩展与执行闭环

AIRI 是一个面向数字角色场景的可运行 Agent 系统,强调实时交互、多形态运行和长期演进。它将输入、推理、执行、反馈组织成可持续迭代的系统,通过分层架构确保复用能力和扩展边界稳定。AIRI 注重请求治理、Provider 管理、插件机制和执行闭环,从“可演示”走向“可运行”,推动 AI 能力迈向系统工程。

Claude在得物App数仓的深度集成与效能演进

Code LLM在电商数仓中的应用,推动了研发范式的升级。通过界定数据确权边界,AI辅助技术实现,确保合规与安全。规范化的输入输出契约,抑制了模型幻觉,提升了数据质量。Galaxy MCP的集成,使大模型能感知和操作企业数据环境,实现智能埋点、OneData建模、周报生成等场景的自动化。认知运行时与执行运行时的解耦,融合了语义理解与高效计算,推动数仓向智能化、自动化演进。

一文读懂:智能体身份权限治理演进实录

【智能体权限治理四步走】"咖啡外卖"智能体BrewSense的进化史揭示AI治理核心:①准入认证防过载→②能力清单控风险→③双重身份明权责→④链式授权阻越权。从单点管控到生态级零信任,每一次权限升级都是业务安全的必经之路。智能体时代,精准授权才是效率的基石!(138字)

Agent 系列(三):Harness Engineering

AI工程重心正从模型调优转向系统设计。"Harness Engineering"成为新趋势,像缰绳般为AI构建执行轨道——通过环境接口、知识结构和反馈机制,将模型爆发力转化为稳定生产力。其核心是搭建可验证、可约束的运行体系,让AI能可靠完成长链路任务。当模型能力趋同,系统设计将成为决胜关键,决定AI能否从"会说"进阶到"会做"。

拒绝“感觉有效”:用数据证明 AI Coding 的真实团队价值【天猫AI Coding实践系列】

天猫团队提出三层AI Coding度量体系,涵盖质量、链路和结果指标,推动AI从工具升级为知识治理基础设施。通过离线评测定位能力短板,在线埋点追踪上下文效果,验证AI的实际价值。核心目标是将“感觉有效”转化为可诊断、可调优、可共识的数据闭环,提升团队知识治理能力。

快速正则搜索:为 agent 工具构建文本索引

正则表达式匹配在Agentic开发中至关重要,但传统工具如grep在处理大规模代码库时效率低下。为提高搜索速度,开发者们探索了多种索引技术,如倒排索引、三元组分解和后缀数组。GitHub的稀疏N-gram方法通过随机提取字符片段,显著提升了查询效率。本地索引的引入不仅减少了网络延迟,还确保了数据新鲜度,为Agentic工作流带来了质的飞跃。

业务逻辑的“坍塌”:当应用层只剩下胶水代码,在 AI Agent 时代,我们该构建什么

AI开发从质疑到驾驭,揭秘大模型不确定性源于硬件异构与数值精度。Agent开发如同胶水层,需平衡Prompt工程、Context管理与工具编排。Transformer架构通过注意力机制实现语义理解,而算力与数据驱动其强大泛化能力。传统架构与AI融合面临概率性挑战,需重构业务流程。理解底层原理,方能高效驾驭AI潜能。

龙虾盛宴下的冷思考

AI工具的流行带来了新的职业和工具断货现象,但很多人使用后不知如何有效利用。AI编程工具虽提升了效率,但存在代码质量不高、伪需求等问题。关键在于找到真实需求,避免自我感动,合理利用AI工具而非盲目依赖。认清瓶颈,谨慎应对认知陷阱,按特长分工使用不同模型,才能让AI真正助力工作。

Home - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.0. UTC+08:00, 2026-03-26 22:10
浙ICP备14020137号-1 $Map of visitor$