话题AI工程 › AI Agent

AI工程:AI Agent

关联话题: 智能体、Multi-Agent、Agent、多Agent、多智能体、ai agents

AI Agent 是通过工程化的手段,为大语言模型提供了获取外部工具、知识的能力。他是介于人类、大语言模型之间的代理。当用户向 AI Agent 输入问题时,AI Agent 可以使用大语言模型作为推理引擎,将一个复杂的任务进行分解、给出任务执行规划。之后 Agent 会调用外部工具获取结果,并将大语言的上次推理和工具调用结果返回给大语言模型,让大语言模型继续思考、规划。如此循环,直到将一个复杂的任务完成。

快速正则搜索:为 agent 工具构建文本索引

正则表达式匹配在Agentic开发中至关重要,但传统工具如grep在处理大规模代码库时效率低下。为提高搜索速度,开发者们探索了多种索引技术,如倒排索引、三元组分解和后缀数组。GitHub的稀疏N-gram方法通过随机提取字符片段,显著提升了查询效率。本地索引的引入不仅减少了网络延迟,还确保了数据新鲜度,为Agentic工作流带来了质的飞跃。

业务逻辑的“坍塌”:当应用层只剩下胶水代码,在 AI Agent 时代,我们该构建什么

AI开发从质疑到驾驭,揭秘大模型不确定性源于硬件异构与数值精度。Agent开发如同胶水层,需平衡Prompt工程、Context管理与工具编排。Transformer架构通过注意力机制实现语义理解,而算力与数据驱动其强大泛化能力。传统架构与AI融合面临概率性挑战,需重构业务流程。理解底层原理,方能高效驾驭AI潜能。

龙虾盛宴下的冷思考

AI工具的流行带来了新的职业和工具断货现象,但很多人使用后不知如何有效利用。AI编程工具虽提升了效率,但存在代码质量不高、伪需求等问题。关键在于找到真实需求,避免自我感动,合理利用AI工具而非盲目依赖。认清瓶颈,谨慎应对认知陷阱,按特长分工使用不同模型,才能让AI真正助力工作。

Building the Universal Commerce Protocol

Shopify推出的通用商务协议(UCP)为AI代理与商家交易提供开放标准,支持灵活的能力发现与谈判。UCP分层设计,核心交易功能与扩展能力分离,商家可自定义功能,代理仅处理支持的操作。协议无需中央审批,支持动态支付谈判与无缝交接,适应多样化的商务需求,推动电商生态持续进化。

Cursor 逆向笔记 1 —— 我是如何拦截解析 Cursor 的 gRPC 通信流量的

小编带你揭秘Cursor AI的通信机制!通过MITM代理抓包,发现Cursor采用读写分离设计:RunSSE长连接接收AI响应流,BidiAppend短连接发送用户消息。协议使用Connect Protocol,proto定义藏在JS文件中,通过解析typeName和fields可还原结构。KV存储让客户端充当缓存层,服务端控制上下文存取。隐私模式下代码仍会上传用于索引,实际数据收集范围比宣称的更广。

Claude Code 里,Subagents 和 Agent Teams 到底怎么选?有什么区别?

Multi-Agent系统有两种核心模式:Sub-agents专注独立任务压缩输出,适合极致并行场景;Agent Teams支持长期协作与点对点通信,适合需持续协调的复杂任务。设计关键在于按上下文而非角色拆分,避免信息衰减。五种常见模式覆盖多数需求,但需警惕过度设计——单Agent调优无效时再考虑多Agent架构。记住:复杂性要为可衡量的收益服务。

知识基座:让“AI 越用越懂业务”的团队经验实践【天猫AI Coding实践系列】

通过构建“AI全栈研发知识基座”,团队系统化梳理业务文档、代码规范等,结合RAG技术嵌入研发流程,提升AI对业务上下文的理解能力。通过信号驱动的智能沉淀机制,自动捕获隐性经验,实现团队知识共享与动态迭代,显著提高研发效率,让AI成为懂业务的智能伙伴。

I Read Hermes Agent's Memory System, and It Fixes What OpenClaw Got Wrong

Hermes Agent构建了一个高效的内存系统,包含四个层次:小型提示内存、可搜索的会话存档、代理管理的技能和可选的深层用户建模。核心设计是将提示保持稳定以优化缓存,其他信息通过工具按需检索。Hermes通过精简的内存文件和SQLite数据库管理历史会话,确保高效检索和总结。这种分层设计使得记忆系统既实用又经济,显著提升了代理的响应速度和成本效益。

从上下文工程到 Harness Engineering

AI Coding虽提升代码生成速度,但未解决测试、验证等非编码工作,导致研发更累。Harness Engineering通过构建Agent专属工具链,让AI接管全生命周期任务,打破70%非编码流程枷锁。工程师角色从编码者转向设计环境,提升Agent可读性,实现受控执行,释放人类创造力。

拒绝重复造轮子!抽象 80% 工作场景,打造可复用的"AI 助手工厂”

AI助手开发常陷入重复造轮子困境,智空间团队将80%高频场景抽象为四大类:复杂指令、知识问答、问题排查和极简场景,并针对每类设计可复用技术方案。通过Prompt插拔架构和分层解耦系统,实现业务方"配"而非"开发"助手。平台沉淀四大模板,内置框架Prompt与业务定制接口,显著降低开发门槛,让专家专注经验沉淀,推动AI应用从"作坊"迈向"工厂"模式。

You Don't Know AI Agents: Principles, Architecture, and Engineering Practices

AI Agent的核心在于感知、决策、动作和反馈的稳定循环,控制流程基本不变。新能力通过工具扩展、提示结构优化和状态外部化实现。上下文工程防止信息稀释,工具设计需符合Agent目标,内存分层管理确保跨会话一致性。长任务稳定性依赖状态外部化,多Agent系统需任务图和隔离边界。评估系统需先修复再调优Agent,Trace是观察性的基础。OpenClaw系统通过消息解耦、状态外部化和严格安全边界实现稳定运行。

用代码"驯服" LLM:AutoHarness 如何让小模型打败大模型

Google DeepMind推出AutoHarness,让LLM自动生成Python代码约束自身输出,在145个文字游戏中实现100%合法动作率。通过固定函数签名和树搜索策略,AutoHarness显著提升LLM在任务中的表现,尤其在单人游戏中,纯代码策略以零推理成本超越GPT-5.2-High。这一创新为解决LLM输出合法性提供了高效自动化方案。

The Anatomy of an Agent Harness

模型是大脑,而“缰绳”(Harness)则是让AI真正干活的系统框架。它通过文件存储、代码执行、沙箱环境等组件,帮模型突破原生限制——比如持久化记忆、实时获取知识、自主解决问题。随着模型进化,部分功能可能内化,但系统级设计仍关键。当前研究正探索多代理协作、自修复机制等前沿方向,让AI更高效可靠。

Harness Engineering Is Cybernetics

AI时代工程模式的进化:从手动操作到"驾驭工程"。就像瓦特蒸汽机的离心调速器取代人工调节,Kubernetes通过声明式配置管理集群,如今工程师不再手写代码,而是设计环境、构建反馈循环,让AI代理完成编码。关键在于将人类判断转化为机器可读的规范——架构文档、定制检查器、黄金原则。传统工程实践的价值被重新放大,忽视文档和测试的代价从缓慢累积变成即时爆发。未来工程师的核心能力不是编写代码,而是定义"正确"的标准并校准系统。

你不知道的 Agent:原理、架构与工程实践

Agent架构的核心在于稳定的控制流和上下文管理,通过工具扩展、提示结构调整和状态外化实现新能力。Harness系统比模型本身更决定系统收敛,高质量验证和清晰目标不可或缺。上下文工程防Context Rot,分层管理信息和记忆,确保信号质量。工具设计遵循ACI原则,边界明确,参数防错。记忆分层管理,跨会话一致性关键。长任务靠状态外化,多Agent先有任务图和隔离再并行。评测系统出问题先修评测,Trace是排查前提。

From firefighting to building: How AI agents restored our team’s core productivity

Grab的ADW团队开发了多代理AI系统,自动处理数据查询和代码修改请求,显著提升了工作效率。该系统通过FastAPI、LangGraph等技术栈,实现复杂任务的分工协作,减少工程师的重复劳动。Agent模块化设计优于单一AI,提高了维护性和准确性。系统部署后,处理时间大幅缩短,团队生产力显著提升,从被动支持转向高价值工作。

Главная - Вики-сайт
Copyright © 2011-2026 iteam. Current version is 2.155.0. UTC+08:00, 2026-03-25 03:30
浙ICP备14020137号-1 $Гость$