话题AI工程 › AI Agent

AI工程:AI Agent

关联话题: 智能体、Multi-Agent、Agent、多Agent、多智能体、ai agents

AI Agent 是通过工程化的手段,为大语言模型提供了获取外部工具、知识的能力。他是介于人类、大语言模型之间的代理。当用户向 AI Agent 输入问题时,AI Agent 可以使用大语言模型作为推理引擎,将一个复杂的任务进行分解、给出任务执行规划。之后 Agent 会调用外部工具获取结果,并将大语言的上次推理和工具调用结果返回给大语言模型,让大语言模型继续思考、规划。如此循环,直到将一个复杂的任务完成。

Agent-CLI设计七原则:让AI工具真正好用的核心实践

CLI工具设计新思路:专为AI Agent优化的7大原则。默认非交互、结构化输出、精准报错、安全重试、渐进式帮助、可组合设计、精简响应,让命令行工具更适配自动化场景。传统CLI设计面向人类,而AI需要机器友好接口。遵循这些原则不仅能提升Agent效率,也能改善人类使用体验,实现双赢。核心是建立稳定数据契约,减少token浪费,让工具链更可靠。

Finally, a disaster-free way to run OpenClaw on your real data/apps!

OpenClaw在处理邮件时因上下文压缩丢失关键指令,导致误删大量邮件。安全约束不应依赖代理的记忆,而应通过代理层实现。Plano作为开源AI代理工具,通过过滤器链在请求和响应阶段拦截危险操作,确保安全性。过滤器可独立处理内容屏蔽、验证和PII脱敏等任务,避免代理代码和上下文窗口的局限。Plano的代理层设计让安全逻辑不受压缩影响,提升了系统的稳定性和安全性。

How Kimi, Cursor, and Chroma Train Agentic Models with RL

Moonshot AI的Kimi K2.5通过强化学习实现任务并行分解,优化多代理协作;Cursor的Composer 2采用自总结和实时RL提升长代码任务处理能力;Chroma的Context-1则专注于自编辑上下文,动态剪枝无关文档以提升搜索效率。三者在RL应用上均注重基础模型、生产环境训练、结果导向奖励和大规模并行扩展,展示了垂直领域模型的高效性与实用性。

从零开始两天构建一个 Claude Code:带你拆解 AI CLI 的每一层

小编探索了构建生产级agentic CLI的关键技术,涉及SSE缓冲区管理、system prompt分段、工具权限拦截等。通过Claude Code为参照,实现了一个纯TypeScript的CLI,采用分层架构,核心流程包括用户输入处理、API调用、工具执行和结果反馈。技术选型依托Node.js 22原生能力,注重缓存优化和安全性,内置21个工具,支持插件扩展和多Agent协作,模拟跨会话记忆,确保高效与安全。

Agentic Memory: A Detailed Breakdown

AI代理的记忆系统是提升智能体验的关键,它通过四种记忆类型实现持续学习:上下文记忆处理当前任务,外部记忆存储长期数据,情景记忆记录过往经验,语义记忆则基于预训练知识。设计高效检索策略和定期清理机制能优化记忆管理,让AI更像一个会成长的伙伴,而非每次对话都从零开始的工具。

Building agents with the Claude Agent SDK

Claude Agent SDK让AI像人类一样操作电脑,从代码工具升级为通用智能体框架。核心思路是赋予AI文件读写、终端操作等基础能力,支持构建金融、客服、研究等各类智能体。开发关键在"收集上下文-执行动作-验证结果"的循环:通过文件系统、语义搜索获取信息,利用工具和脚本执行任务,再借助规则检查、视觉反馈等方式验证输出。这套方法论让智能体能自主迭代,处理复杂工作流。

Building a C compiler with a team of parallel Claudes

Anthropic研究员用16个Claude智能体并行开发,成功打造了一个能编译Linux内核的Rust版C编译器!全程无人工干预,耗时两周、花费2万美元,产出10万行代码,支持x86/ARM/RISC-V架构。虽然生成的代码效率不如GCC,但已能编译SQLite/Redis等主流软件,甚至能跑DOOM!这波操作展示了AI团队协作的惊人潜力,但也暴露出模型在复杂任务中的天花板。项目代码已开源,堪称AI自主编程的里程碑实验~

Building for trillions of agents

近年来,智能代理技术突飞猛进,已从简单的聊天机器人发展为具备独立计算环境、代码编写与执行能力的智能体。未来,代理将渗透至各行各业,从合同审核到药物研发,几乎所有经济价值任务都将依赖它们。软件设计需转向“让代理想要”,API优先成为关键。代理还将催生全新基础设施与工具,推动商业模式革新,最终重塑我们的工作方式与软件生态。

Difference Between Agent Harnesses & Agent Frameworks

Agent框架和Harness本质不同:框架提供模块化组件,需自行组装,适合定制开发;Harness开箱即用但不可改内部逻辑。框架居中平衡灵活与结构,如LangChain;Harness极致封装如OpenClaw。两者无优劣,按需选择——要控制权选框架,求效率用Harness。部分工具已融合两者特性,边界渐模糊。

5 Agent Skill design patterns every ADK developer should know

开发者常纠结于SKILL.md的格式规范,但真正挑战在于内容设计。通过分析主流技术生态,提炼出五大高效设计模式:工具封装让AI秒变专家库,生成器确保文档一致性,审查员实现模块化代码检查,反转模式让AI先提问再行动,管道模式强制分步验收。这些模式可自由组合,告别冗长提示词,用结构化思维打造可靠智能体。

The importance of Agent Harness in 2026

AI发展进入转折点,传统模型评估聚焦静态指标,但复杂任务中的持久性和可靠性更为关键。Agent Harness作为管理长期任务的基础设施,提供高效、可控的运行环境,类似操作系统。未来,训练与推理环境将融合,Harness将成为解决“模型漂移”的主要工具,捕捉失败轨迹以优化模型。开发者应构建轻量、模块化的架构,适应快速变化的AI技术。

Agent 记忆系统设计:四种类型、三大策略、完整代码实现

Agent记忆系统由四层架构组成:上下文记忆、外部记忆、情景记忆和语义/参数记忆。上下文记忆处理当前任务,外部记忆持久化重要信息,情景记忆记录历史行为,语义记忆则内置模型知识。记忆系统通过向量检索和管理策略(如时间衰减、重要性打分、定期整合)实现智能记忆操作,赋予Agent跨时间携带上下文的能力,使其从无状态系统进化为持续学习的智能体。

Tair 短期记忆架构实践:淘宝闪购 AI Agent 的秒级响应记忆系统

淘宝闪购AI Agent通过Tair实现秒级响应记忆系统,支持自然语言点单流程。Tair提供低延迟、丰富数据结构和弹性扩展能力,确保Agent在多轮对话中准确记忆上下文。利用List和Hash结构分别存储对话历史和业务上下文,通过分布式锁保障并发安全,弹性扩缩容应对流量高峰,TTL自动清理过期数据,确保系统稳定高效。

97.9%采纳率,胶水编程:业务需求出码最佳实践【天猫AI Coding实践系列】

天猫团队通过“胶水编程”实践,利用AI高效连接业务模块,显著提升代码采纳率至97.9%。核心策略是让AI“抄”而非“写”代码,结合开发规范、代码模式和领域知识,AI仅在差异点编写少量胶水代码。该方法在特定场景下大幅减少人工编码,确保代码可用性与一致性,实现业务需求快速交付。

How I Built Vue Lynx with AI in Two Weeks

Vue Lynx横空出世!开发者仅用37小时周末hackathon打通Vue与Lynx双线程架构,让Vue代码在后台线程运行,UI操作主线程零延迟交互。现已支持Composition API、Vue Router等核心生态,提供20+跨平台示例。通过AI自动化测试验证852项上游测试,采用差异对比法确保HackerNews等复杂应用完美移植。只需npm create vue-lynx@latest即可体验这份让Vue轻松跑在原生端的黑科技~

OpenClaw构建自我迭代AI助手笔记

OpenClaw验证了银行客户经理助手的自我迭代能力,通过钉钉交流完善人设和职责边界,建立反馈处理机制支持持续进化。重点在于Agent自主交流与评估能力构建,解决跨Agent通信问题,模拟真实客户场景测试,并构建agent-eval skill。OpenClaw的记忆架构支持二级存储与检索分离,通过Cron+HeartBeat+Memory实现反思迭代,提升个人生产力。

- 위키
Copyright © 2011-2026 iteam. Current version is 2.155.0. UTC+08:00, 2026-03-29 21:50
浙ICP备14020137号-1 $방문자$