话题AI工程 › AI Agent

AI工程:AI Agent

关联话题: 智能体、Multi-Agent、Agent、多Agent、多智能体、ai agents

AI Agent 是通过工程化的手段,为大语言模型提供了获取外部工具、知识的能力。他是介于人类、大语言模型之间的代理。当用户向 AI Agent 输入问题时,AI Agent 可以使用大语言模型作为推理引擎,将一个复杂的任务进行分解、给出任务执行规划。之后 Agent 会调用外部工具获取结果,并将大语言的上次推理和工具调用结果返回给大语言模型,让大语言模型继续思考、规划。如此循环,直到将一个复杂的任务完成。

一文讲透如何构建Harness——六大组件全解析

【AI Agent工程新范式】
裸模型四大硬伤:失忆、代码不能跑、知识过期、无工作环境。Harness六大组件破局:文件系统管存储、沙箱执行自验证、AGENTS.md动态注入知识、Web搜索突破信息时效、上下文工程防信息过载、编排+Hooks保障多Agent协作。核心公式:Agent=模型+Harness——模型决定下限,工程化套件定义上限。2025年趋势表明,AI落地的关键不在模型参数,而在如何用Harness将智能转化为生产力。

What you can learn and copy from the 500,000 line Claude Code leak

Claude Code的源码泄露揭示了Anthropic在AI模型行为控制、安全防护和用户体验优化上的深度策略。系统提示精准引导模型行为,避免过度抽象和虚假报告;安全机制细致入微,防御Zsh攻击和秘密泄露;用户体验设计巧妙,如Tamagotchi伙伴和随机加载动词,提升趣味性。此外,Anti-Distillation技术通过注入虚假工具防御竞争对手模型训练,展现了AI产品的前瞻性防御思维。这些细节体现了Anthropic在AI产品开发中的高水准和深度思考。

AI 工程的真实代价:从 Claude Code 泄露源码看新模型接入的工程现实

Claude Code源码泄露揭示了AI工程的核心困境:新模型接入成熟系统的代价远超预期。反蒸馏技术通过三层防线保护模型能力,而缓存优化和流式解析则展现了系统性能的精细权衡。模型行为的边界案例暴露了行为退化和签名不兼容等问题,工程师通过最小化补丁逐个封堵。这些案例反映了模型能力进步与系统复杂性增长的矛盾。

一文了解 Anthropic 的 Claude Code 源码:为什么它就是比别人好用?

Claude Code被曝51万行源码,揭露三大核心设计:1)动态组装7层提示词系统,工具手册直喂AI;2)42个工具按需加载,fail-closed安全机制确保"先读后改"铁律;3)蜂群架构+记忆蒸馏,子Agent严格分层执行。这哪是编程工具?分明是用LLM当内核的操作系统!安全审查占90%代码量,Anthropic用极端工程化实现"无笼信任"。

采纳率从7.9%到54%:快手智能Code Review的三阶进化

快手在AI研发中,智能代码审查系统通过三代架构演进,从LLM启发式到知识引擎驱动,再到Agentic自主决策,显著提升代码评审效率和质量。系统结合上下文引擎、确定性规则和多层过滤,解决AI幻觉问题,评审采纳率从7.9%跃升至54%,MR评审时长缩短9.9%。智能CR系统不仅提升个人效率,还推动组织整体效能,成为可信赖的生产力工具。

CoPaw深度解析:源码架构和功能实践

CoPaw是一款开源桌面Agent工具,基于AgentScope框架开发,支持自定义Skills和Agent模块,灵活扩展性强。其架构包含Agent核心、Skills、MCP客户端、记忆管理、模型提供、消息通道、工作流和定时任务八大模块,支持本地与云端部署。用户可通过Skills标准化流程处理复杂任务,集成主流社交平台,实现多场景智能交互。

Harness Engineering 来了,SDD 还有意义吗?

Harness Engineering与SDD本质互补:前者构建AI工作环境,后者提供结构化规范。规范是AI推理的地图、约束的语义基础及验证依据,其质量直接影响Agent输出。随着Harness工具增强,规范的重要性不降反升——它决定了AI执行的上限。OpenAI实践表明,将意图转化为可执行的精确定义,比直接审查代码更高效。核心在于用规范前置成本换取后期返工收益。

我用 Go 重写了一个 OpenClaw 框架:这就是 GoClaw

GoClaw是一款用Go语言编写的本地AI助手框架,灵感来自OpenClaw。它通过WebSocket/HTTP提供服务,支持多平台消息接入,具备双循环任务处理、工具调用、技能扩展等核心功能。设计上强调轻量稳定,内置故障恢复和状态管理,适合长期运行。相比Python/Node方案,Go实现让部署更简单,性能更可靠。项目开源,可快速构建能实际完成任务的智能助手。

认知重建之后,步入Agentic Engineering的工程革命

Agentic Engineering 是一种工程范式,通过系统化上下文管理和知识沉淀,让人从编写代码转变为协调AI Agent。其核心在于让AI具备自主性和记忆力,提升工程效率。实践表明,Agentic Engineering 不是预先设计的,而是在解决真实问题的过程中逐步演化而来,最终形成了一套包含多个Agent、Skill和命令的工程体系。

从 Vibe Coding 到范式编程:用 Spec 打造淘系交易的 AI 领域专家

AI编程正从“Vibe Coding”向“范式编程”演进,核心是通过结构化规范驱动AI生成企业级代码。当前AI工具因缺乏领域知识和规范约束,生成代码不可靠、难维护。范式编程将规范置于开发中心,结合知识库与AI Agent,构建可沉淀、复用的AI领域专家体系,实现人机协同的范式升级,提升代码质量和效率。

学习笔记:从 Agent 到 Skills — AI 智能体架构的范式转变

Anthropic在14个月内推出MCP和Agent Skills两大开放标准,推动AI架构从单体Agent转向"薄Agent+可组合Skills+标准化工具连接"的分层模式。OpenClaw作为开源实践标杆,验证了Skills生态的可行性。实验显示,同一任务在Claude Code和OpenClaw环境均可运行,Skills与MCP代码无需修改。分层架构让知识、工具、协作各司其职,类似软件工程从单体到微服务的演进历程。2026年Skills市场化与安全治理将成为焦点。

The capability overhang in AI

AI技术迅猛发展,尤其在编码领域表现突出,能够处理复杂任务和大型项目。然而,在其他知识工作中,AI仍处于辅助阶段,大规模自动化尚未成熟。企业面临的最大挑战是如何为AI提供正确的上下文信息,这需要解决数据格式、权限管理和系统集成等问题。未来,谁能简化AI的部署和上下文获取,谁就能在竞争中领先。AI的扩散虽需时间,但其潜力巨大,将深刻改变知识工作领域。

Agent-CLI设计七原则:让AI工具真正好用的核心实践

CLI工具设计新思路:专为AI Agent优化的7大原则。默认非交互、结构化输出、精准报错、安全重试、渐进式帮助、可组合设计、精简响应,让命令行工具更适配自动化场景。传统CLI设计面向人类,而AI需要机器友好接口。遵循这些原则不仅能提升Agent效率,也能改善人类使用体验,实现双赢。核心是建立稳定数据契约,减少token浪费,让工具链更可靠。

Finally, a disaster-free way to run OpenClaw on your real data/apps!

OpenClaw在处理邮件时因上下文压缩丢失关键指令,导致误删大量邮件。安全约束不应依赖代理的记忆,而应通过代理层实现。Plano作为开源AI代理工具,通过过滤器链在请求和响应阶段拦截危险操作,确保安全性。过滤器可独立处理内容屏蔽、验证和PII脱敏等任务,避免代理代码和上下文窗口的局限。Plano的代理层设计让安全逻辑不受压缩影响,提升了系统的稳定性和安全性。

How Kimi, Cursor, and Chroma Train Agentic Models with RL

Moonshot AI的Kimi K2.5通过强化学习实现任务并行分解,优化多代理协作;Cursor的Composer 2采用自总结和实时RL提升长代码任务处理能力;Chroma的Context-1则专注于自编辑上下文,动态剪枝无关文档以提升搜索效率。三者在RL应用上均注重基础模型、生产环境训练、结果导向奖励和大规模并行扩展,展示了垂直领域模型的高效性与实用性。

从零开始两天构建一个 Claude Code:带你拆解 AI CLI 的每一层

小编探索了构建生产级agentic CLI的关键技术,涉及SSE缓冲区管理、system prompt分段、工具权限拦截等。通过Claude Code为参照,实现了一个纯TypeScript的CLI,采用分层架构,核心流程包括用户输入处理、API调用、工具执行和结果反馈。技术选型依托Node.js 22原生能力,注重缓存优化和安全性,内置21个工具,支持插件扩展和多Agent协作,模拟跨会话记忆,确保高效与安全。

首页 - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.2. UTC+08:00, 2026-04-29 08:07
浙ICP备14020137号-1 $访客地图$