AI工程:AI Agent
AI Agent 是通过工程化的手段,为大语言模型提供了获取外部工具、知识的能力。他是介于人类、大语言模型之间的代理。当用户向 AI Agent 输入问题时,AI Agent 可以使用大语言模型作为推理引擎,将一个复杂的任务进行分解、给出任务执行规划。之后 Agent 会调用外部工具获取结果,并将大语言的上次推理和工具调用结果返回给大语言模型,让大语言模型继续思考、规划。如此循环,直到将一个复杂的任务完成。
你不知道的 Agent:原理、架构与工程实践
Agent架构的核心在于稳定的控制流和上下文管理,通过工具扩展、提示结构调整和状态外化实现新能力。Harness系统比模型本身更决定系统收敛,高质量验证和清晰目标不可或缺。上下文工程防Context Rot,分层管理信息和记忆,确保信号质量。工具设计遵循ACI原则,边界明确,参数防错。记忆分层管理,跨会话一致性关键。长任务靠状态外化,多Agent先有任务图和隔离再并行。评测系统出问题先修评测,Trace是排查前提。
From firefighting to building: How AI agents restored our team’s core productivity
Grab的ADW团队开发了多代理AI系统,自动处理数据查询和代码修改请求,显著提升了工作效率。该系统通过FastAPI、LangGraph等技术栈,实现复杂任务的分工协作,减少工程师的重复劳动。Agent模块化设计优于单一AI,提高了维护性和准确性。系统部署后,处理时间大幅缩短,团队生产力显著提升,从被动支持转向高价值工作。
OpenViking 实战教程:搭建多仓库代码语义检索系统,赋能 AI 助手 & OpenClaw 记忆插件 2.0 升级
多仓库代码问答常因上下文缺失、语义检索低效而困难。OpenViking通过聚合多仓库代码、构建语义索引,显著提升AI助手的跨仓库检索能力。实测显示,集成OpenViking后问答准确率从40%提升至90%,同时降低30%的Token成本。安装只需pip install openviking,支持本地或GitHub仓库导入,还能与飞书等聊天工具深度集成,让开发者轻松实现智能代码问答。
企业级 Agent 多智能体架构与选型指南 -- 来自1000+行业应用实践积累
AgentScope框架支持多种多智能体模式,如Pipeline、Routing、Skills等,适用于不同业务场景。开发者可基于ReActAgent单智能体优先原则,逐步演进至多智能体架构。Spring AI Alibaba与AgentScope协同,提供Graph编排能力,支持工作流式与对话式多智能体混合编排,提升开发效率与系统可靠性。
打破“知识孤岛”:微服务架构下的自动化业务图谱构建
微服务架构下,业务知识分散、配置变更风险高、协作效率低等问题愈发突出。通过自动化业务知识图谱,实现了前后端代码分析、知识图谱建模和多源数据融合,构建了智能影响分析、业务知识问答和页面级灰度管理等核心应用场景,显著提升了业务理解和运维效率。技术挑战中,前端扫描自适应架构、后端配置三重识别机制和多源数据一致性保障是关键突破。未来将持续优化图谱数据、探索AI应用和增强可视化。
Review the spec, not the code
AI生成代码正颠覆传统开发流程,PR数量激增但有效审查率暴跌。旧式逐行审阅模式在AI时代已失效,70%的AI代码因不被信任遭拒。关键在于转变思路:从审查代码转向前置验证需求文档,用类型检查、自动化测试、自定义规则等多层防护网替代人工检查。真正的风险往往藏在未被明确记录的架构决策中,而非代码细节。团队需重构流程,将质量关卡前移至需求设计阶段,用机器可验证的规范约束AI输出,释放工程师精力聚焦核心设计问题。
深入理解OpenClaw技术架构与实现原理(上)
OpenClaw是一款高效的个人AI助手,其技术架构以本地优先为核心,具备高度灵活性和扩展性。核心组件包括Gateway网关、Pi Agent智能体运行时、Channels频道连接生态、Nodes设备节点与伴侣应用等。OpenClaw通过AI-Coding实现软件开发范式的革新,提供了统一控制平面、智能体循环、定时任务系统、工具系统等模块,支持多频道集成、跨设备硬件控制、安全沙箱机制等功能,展现了强大的个人助手能力。
从架构到代码:深入理解 OpenClaw 的双源记忆系统
OpenClaw通过分层记忆系统,解决了AI助手在多平台交互中的记忆统一问题。它将记忆从上下文中剥离,构建了持久化、可搜索的知识库,支持动态和静态记忆的双源存储。动态记忆自动记录会话,静态记忆则提炼关键信息。记忆检索采用混合搜索策略,结合向量和关键词,确保信息高效调用。这一设计使OpenClaw能够长期积累用户偏好,实现从工具到伙伴的进化。
Ranking Engineer Agent (REA): The Autonomous AI Agent Accelerating Meta’s Ads Ranking Innovation
Meta推出自主AI代理REA,革新广告排名模型的机器学习生命周期。REA自主生成假设、启动训练任务、调试失败并迭代结果,显著提升模型准确度和工程效率。通过休眠唤醒机制,REA管理跨天乃至跨周的异步工作流,减少人工干预,实现高效持续操作。REA结合历史数据和前沿研究,生成高质量假设,并在计算预算内灵活应对现实约束。其首次生产验证中,模型准确度翻倍,工程产出提升五倍,为ML工程带来新范式。
被 Karpathy 下场推荐的 NanoClaw 是什么来头
OpenClaw一夜爆红,成为GitHub最受欢迎开源项目,其IM远程操控电脑的AI助手形态满足了大众对Jarvis的幻想。NanoClaw则以其小巧易懂、容器隔离安全的特点,被Karpathy推荐。两者各有优势,OpenClaw功能全面但安装复杂,NanoClaw安装简便且安全,但生态尚不完善。Claws项目虽前景广阔,但技术护城河浅,未来面临激烈竞争。
AI Coding前端实践后的复盘总结
AI Coding在前端开发中展现显著效率,尤其在样板代码生成和UI组件搭建上。然而,复杂业务逻辑和样式细节仍需人工干预。通过优化提示词、建立知识库和严格代码审查,团队提炼出“人机协同”最佳工作流,提升研发速度与质量。AI Coding工具虽便捷,但依赖高质量Prompt和知识库,未来需加强AI驱动的代码审查体系建设,确保智能化开发的可持续性。
我给 OpenClaw 杀了 47 次僵尸进程,终于想明白了一些事
OpenClaw虽火但坑多,Gateway单点故障频发,钉钉集成体验割裂。其成功在于将"万能AI助理"概念具象化,30万Star背后是技术叙事的力量。本地模式自由但风险自担,云端方案省心却受限。Skill模式颠覆传统工程,但架构决策仍需人力。AI写代码易,做产品难,测试覆盖救不了体验短板。未来已来一半,既别神话也别抵抗,赶紧上手才是真。
兄弟!你真的懂 Skill 吗?
Anthropic的Skill系统通过SKILL.md和skill_run沙箱实现AI能力的灵活调用,而非依赖function calling。系统支持五种执行模式:纯Prompt注入、脚本执行、库调用、参考文档渐进加载和编排型。SKILL.md作为核心,既是使用手册也是知识传递工具,LLM通过阅读SKILL.md自主决定执行方式。skill_run则提供安全隔离的执行环境,支持多种语言和命令,极大提升了AI的任务处理能力。
基于 Cursor Agent 的流水线 AI CR 实践
AI代码审查(CR)能自动检测代码质量问题,弥补人工审查的不足。前端开发中,AI CR通过流水线自动触发,生成报告并引导开发者优化代码。Cursor Agent CLI集成到流水线中,提供高效、低误报的CR解决方案。内置提示词工程和模型选择进一步提升了审查效率和准确性,推动AI CR在现代开发流程中的应用和普及。
Improving Deep Agents with harness engineering
通过优化编码代理的“套件”,我们将其在Terminal Bench 2.0的表现从Top 30提升至Top 5。核心在于自我验证与追踪技术,帮助代理更好地完成任务。我们调整了系统提示、工具和中间件,增强了代理的自我验证能力,使其在构建、验证和修复过程中更加高效。此外,我们还为代理提供了环境上下文,帮助其更好地理解任务要求,避免陷入无效循环。这些改进显著提升了代理的性能,展示了套件工程在优化模型任务表现中的重要作用。
Harness engineering: leveraging Codex in an agent-first world
OpenAI团队用Codex打造百万行代码产品,全程零人工手写!工程师仅需设计框架、明确需求,AI自主完成开发、测试、部署全流程,效率提升10倍。核心发现:人类角色转向"环境架构师",通过精准提示和反馈循环引导AI高效工作。代码库完全由AI生成,强调结构化文档和机械约束,而非代码风格。虽面临上下文管理、架构漂移等挑战,但证明AI协作可大幅释放人力,聚焦高价值设计。未来关键在于构建更智能的AI开发环境与控制体系。