AI工程:AI Agent
AI Agent 是通过工程化的手段,为大语言模型提供了获取外部工具、知识的能力。他是介于人类、大语言模型之间的代理。当用户向 AI Agent 输入问题时,AI Agent 可以使用大语言模型作为推理引擎,将一个复杂的任务进行分解、给出任务执行规划。之后 Agent 会调用外部工具获取结果,并将大语言的上次推理和工具调用结果返回给大语言模型,让大语言模型继续思考、规划。如此循环,直到将一个复杂的任务完成。
从第一性原理思考 Agentic Engineering
AI时代下,软件工程正经历范式转变。Agentic Engineering提出人机深度协作新思路,通过结构化知识管理、全流程参与和精细验证机制,在保证质量的同时释放AI潜能。开源框架将方法论落地为可执行的Skill体系,实现工程经验的可复用与自进化。面对技术浪潮,工程师需聚焦问题本质与系统思维,在变局中把握不变的价值锚点。
深入源码:Hermes Agent 如何实现 "Self-Improving"
Hermes Agent凭借自进化能力崛起,OpenRouter排行榜增速达204%。它通过Memory记录用户偏好,Skill提炼操作经验,Nudge Engine定时复盘,形成闭环学习系统。相比OpenClaw的手写配置,Hermes能自动积累经验并优化执行流程,越用越高效。源码解析揭示三大子系统协同机制,安全设计确保进化可控。RDSHermes进一步降低使用门槛,让非开发者也能享受AI进化红利。
OpenAI Agents SDK:生产级智能体开发的工程化利器
OpenAI Agents SDK v0.14.2 推出智能体开发框架,解决现有智能体开发的三大困境,提供更强的控制层和原生沙箱执行能力,确保安全与隔离。SDK 接管底层循环与工具链,开发者只需专注业务逻辑,快速构建可靠、可扩展的智能体应用。
你写的 Skill,及格了吗?
本文提出了一套8维度的Skill量化评估框架,通过元数据质量、执行引导清晰度、领域知识密度等指标对Skill进行打分评级,解决了Skill质量难以客观衡量的问题。为提升评估可靠性,设计了多模型交叉验证流程,并适配不同AI工具环境提供四种执行策略。该框架既能帮助开发者识别改进短板,也能辅助用户横向对比选择优质Skill。
基于 Spring AI 从0到1构建 AI Agent
本文分享了一个基于Spring AI的AI Agent开发实践,通过生成代码来学习AI Agent开发。项目集成了RAG、Function Calling、MCP、SubAgent等核心模块,展示了从意图识别到工具调用的完整流程。AgentCore作为系统大脑,负责编排对话流程,ChatMemory管理对话记忆,Tool机制让LLM具备调用工具的能力。RAG模块通过多路召回和Rerank实现知识库检索,Command和Skill提供了两种Prompt模板机制,SubAgent支持独立记忆的任务执行。MCP协议实现了与外部服务的动态连接,扩展了Agent的能力边界。整个项目体现了AI Agent开发的工程化思路,Function Calling作为核心地基,支撑了多种复杂能力的实现。
Harness Engineering:AI 能在真正"出事会炸"的后端系统里写代码吗?
腾讯CDN团队探索AI在高风险后端系统的应用,通过Rust版Nonstop代理框架验证AI编码能力,并构建五层架构确保代码质量。面对复杂场景,团队采用多模型对抗审查和实时反馈机制,将效率提升20%。AI时代下,工程师角色转向设计约束规则,核心能力仍是抽象思维与问题预防。工程体系的持续进化比单次效率提升更重要。
全方位对比:Hermes VS OpenClaw
Hermes通过自修复和动态技能库机制,实现AI助手的自我进化,专注于深度任务处理,如代码编写与数据分析。相比之下,OpenClaw强调多平台集成与规模化运营。两者分别解决不同问题,开发者可根据需求选择或组合使用。未来AI Agent市场将趋向差异化共存,Hermes的本地化策略与中国市场深度融合,带来全新商业机遇。
从玩具到生产力:用真实项目讲透 AI Agent 的 Harness Engineering
大模型时代,程序员角色正从代码编写者转向目标定义与验收者。Harness工程体系通过约束执行边界、接入业务能力、观测调试状态,将大模型纳入企业交付流程。Harness不仅是管理非确定性引擎的控制面,更是重塑工程师工作方式的关键,推动从执行者到控盘者的身份迁移。
我把 Karpathy 的 AutoResearch 搬到了软件开发领域,效果炸了
这个项目将Karpathy的AutoResearch方法迁移到软件开发领域,通过多AI Agent交叉审核、5维度量化评分和反馈驱动迭代,构建了全自动开发系统。系统以program.md为核心规则,实现从GitHub Issue识别到代码合并的闭环,10分钟内可完成中等复杂度任务,代码质量达9.0/10分。实践表明,该系统显著提升效率并降低人力成本。
从提需求到部署发布,全AI全自动化后,研发效能全面跃升
从需求到部署,我们打通了技术方案生成、测试环境创建、接口自测等关键环节,构建"需求-PRD-代码-交付"闭环。通过标准化流程、知识库与Skills沉淀,实现90%代码采纳率,研发效能提升80%。未来将融合交付与治理双框架,打造自适应AI工程体系,迈向L3级无人值守。
深度解析 Claude Code 在 Prompt / Context / Harness 的设计与实践
Claude Code的设计哲学从Prompt、Context到Harness层层递进,构建了AI Coding Agent的顶级工程实践。其动态组装的System Prompt像搭积木般灵活,CLAUDE.md文件实现精准项目指引,三层压缩体系巧妙平衡记忆与效率。六大内置Agent各司其职,Verification Agent堪称代码质检官。精细的权限控制与沙箱隔离筑起安全防线,而异步生成器架构让长任务稳如磐石。彩蛋功能更展现Anthropic的工程浪漫,将严谨与趣味完美融合。
How we built our multi-agent research system
多智能体系统通过并行分工显著提升研究效率:主代理协调任务,子代理同步执行搜索,比单代理快90%。架构核心是动态任务分解与工具协同——主代理规划策略,子代理分头探索后汇总结果。关键技巧包括:1)提示工程需模拟代理思维,明确分工;2)工具设计要精准匹配任务;3)采用广度优先搜索策略。系统消耗15倍于聊天的算力,但对复杂查询效果显著,如准确抓取标普500公司董事会数据。错误处理采用断点续查机制,确保长时任务稳定性。
从Vibe Coding到Agentic Engineering:重构后台开发全流程
AI赋能后台开发全流程!从需求口述到代码发布,Claude Code串联PM、Git、DevOps等平台,实现终端一站式开发。AI智能体负责代码生成、计划执行、自审修复,开发者只需关键节点把关。结构化流程确保质量,告别"提示即祈祷"。实践显示,10分钟完成4个并行开发任务,MR描述自动生成,评审意见精准定位修复。Agentic Engineering让AI成为高效执行者,开发者变身流程编排者。
卡片式对话的协议方案探索和思考
智能助手对话流中,卡片式交互的实现涉及复杂系统设计。通过代码块扩展、占位符替换和自定义标签三种方案,卡片无缝嵌入Markdown流。数据获取模式从模型直出逐步演进至Tool驱动,确保实时性与准确性。最终,四层统一协议体系(Markdown标记、消息传输、UI渲染、事件通信)为多端一致性、数据实时性及跨团队协作提供了标准化架构,助力高效卡片式对话系统构建。
The AI-native transformation path, end to end
AI转型分为四个阶段:代理采用、AI原生、扩展范围和全面编排。目前,70%的组织处于第一阶段,仅少数进入第三阶段。目标是通过代理编排,实现软件开发生命周期的自动化。在代码生成、验证和构建失败等环节,代理已主导工作,而代码审查和事故响应仍需改进。工程师需从代码编写者转向意图定义者,确保系统理解不因自动化而丢失。转型不仅是工具变革,更是角色和技能的全面重塑。
AI翻译:出海企业如何跨越“语言鸿沟”?
AI翻译技术正迅速进化,从传统神经网络的30+语言到Meta MMS的1000+语言覆盖。然而,精准翻译仍面临挑战,尤其涉及场景理解和敏感信息处理。Lalamove通过多Agent翻译框架,结合专业术语库、参考译文和上下文注入,实现了快速、地道且低成本的翻译方案,显著提升海外开城效率,同时确保安全合规。