AI工程:AI Agent
AI Agent 是通过工程化的手段,为大语言模型提供了获取外部工具、知识的能力。他是介于人类、大语言模型之间的代理。当用户向 AI Agent 输入问题时,AI Agent 可以使用大语言模型作为推理引擎,将一个复杂的任务进行分解、给出任务执行规划。之后 Agent 会调用外部工具获取结果,并将大语言的上次推理和工具调用结果返回给大语言模型,让大语言模型继续思考、规划。如此循环,直到将一个复杂的任务完成。
Harness Engineering:AI 能在真正"出事会炸"的后端系统里写代码吗?
腾讯CDN团队探索AI在高风险后端系统的应用,通过Rust版Nonstop代理框架验证AI编码能力,并构建五层架构确保代码质量。面对复杂场景,团队采用多模型对抗审查和实时反馈机制,将效率提升20%。AI时代下,工程师角色转向设计约束规则,核心能力仍是抽象思维与问题预防。工程体系的持续进化比单次效率提升更重要。
全方位对比:Hermes VS OpenClaw
Hermes通过自修复和动态技能库机制,实现AI助手的自我进化,专注于深度任务处理,如代码编写与数据分析。相比之下,OpenClaw强调多平台集成与规模化运营。两者分别解决不同问题,开发者可根据需求选择或组合使用。未来AI Agent市场将趋向差异化共存,Hermes的本地化策略与中国市场深度融合,带来全新商业机遇。
从玩具到生产力:用真实项目讲透 AI Agent 的 Harness Engineering
大模型时代,程序员角色正从代码编写者转向目标定义与验收者。Harness工程体系通过约束执行边界、接入业务能力、观测调试状态,将大模型纳入企业交付流程。Harness不仅是管理非确定性引擎的控制面,更是重塑工程师工作方式的关键,推动从执行者到控盘者的身份迁移。
我把 Karpathy 的 AutoResearch 搬到了软件开发领域,效果炸了
这个项目将Karpathy的AutoResearch方法迁移到软件开发领域,通过多AI Agent交叉审核、5维度量化评分和反馈驱动迭代,构建了全自动开发系统。系统以program.md为核心规则,实现从GitHub Issue识别到代码合并的闭环,10分钟内可完成中等复杂度任务,代码质量达9.0/10分。实践表明,该系统显著提升效率并降低人力成本。
从提需求到部署发布,全AI全自动化后,研发效能全面跃升
从需求到部署,我们打通了技术方案生成、测试环境创建、接口自测等关键环节,构建"需求-PRD-代码-交付"闭环。通过标准化流程、知识库与Skills沉淀,实现90%代码采纳率,研发效能提升80%。未来将融合交付与治理双框架,打造自适应AI工程体系,迈向L3级无人值守。
深度解析 Claude Code 在 Prompt / Context / Harness 的设计与实践
Claude Code的设计哲学从Prompt、Context到Harness层层递进,构建了AI Coding Agent的顶级工程实践。其动态组装的System Prompt像搭积木般灵活,CLAUDE.md文件实现精准项目指引,三层压缩体系巧妙平衡记忆与效率。六大内置Agent各司其职,Verification Agent堪称代码质检官。精细的权限控制与沙箱隔离筑起安全防线,而异步生成器架构让长任务稳如磐石。彩蛋功能更展现Anthropic的工程浪漫,将严谨与趣味完美融合。
How we built our multi-agent research system
多智能体系统通过并行分工显著提升研究效率:主代理协调任务,子代理同步执行搜索,比单代理快90%。架构核心是动态任务分解与工具协同——主代理规划策略,子代理分头探索后汇总结果。关键技巧包括:1)提示工程需模拟代理思维,明确分工;2)工具设计要精准匹配任务;3)采用广度优先搜索策略。系统消耗15倍于聊天的算力,但对复杂查询效果显著,如准确抓取标普500公司董事会数据。错误处理采用断点续查机制,确保长时任务稳定性。
从Vibe Coding到Agentic Engineering:重构后台开发全流程
AI赋能后台开发全流程!从需求口述到代码发布,Claude Code串联PM、Git、DevOps等平台,实现终端一站式开发。AI智能体负责代码生成、计划执行、自审修复,开发者只需关键节点把关。结构化流程确保质量,告别"提示即祈祷"。实践显示,10分钟完成4个并行开发任务,MR描述自动生成,评审意见精准定位修复。Agentic Engineering让AI成为高效执行者,开发者变身流程编排者。
卡片式对话的协议方案探索和思考
智能助手对话流中,卡片式交互的实现涉及复杂系统设计。通过代码块扩展、占位符替换和自定义标签三种方案,卡片无缝嵌入Markdown流。数据获取模式从模型直出逐步演进至Tool驱动,确保实时性与准确性。最终,四层统一协议体系(Markdown标记、消息传输、UI渲染、事件通信)为多端一致性、数据实时性及跨团队协作提供了标准化架构,助力高效卡片式对话系统构建。
The AI-native transformation path, end to end
AI转型分为四个阶段:代理采用、AI原生、扩展范围和全面编排。目前,70%的组织处于第一阶段,仅少数进入第三阶段。目标是通过代理编排,实现软件开发生命周期的自动化。在代码生成、验证和构建失败等环节,代理已主导工作,而代码审查和事故响应仍需改进。工程师需从代码编写者转向意图定义者,确保系统理解不因自动化而丢失。转型不仅是工具变革,更是角色和技能的全面重塑。
AI翻译:出海企业如何跨越“语言鸿沟”?
AI翻译技术正迅速进化,从传统神经网络的30+语言到Meta MMS的1000+语言覆盖。然而,精准翻译仍面临挑战,尤其涉及场景理解和敏感信息处理。Lalamove通过多Agent翻译框架,结合专业术语库、参考译文和上下文注入,实现了快速、地道且低成本的翻译方案,显著提升海外开城效率,同时确保安全合规。
赛博鸡生蛋,7小时用Claude Vibe Coding一个Mini-Claude
本文分享了如何利用Vibe Coding模拟Claude,实现一个精简版Mini-Claude的过程。通过调用LLM API,作者实践了Coding Agent的核心逻辑,包括CLI交互、Tool调用及会话管理。开发过程中,作者逐步构建了工具调用、消息组装、CLI界面等功能,并最终实现了Mini-Claude的闭环操作流程。代码与详细解读已开源,适合对Coding Agent底层逻辑感兴趣的开发者参考。
一文讲透:Harness Engineering即控制论!
AI编程本质是控制论的工程化实现,人类从代码编写者转型为规则制定者。OpenAI实践表明,通过设计环境、明确意图、构建反馈回路,3名工程师5个月完成百万行系统。控制论三要素——信息、控制、反馈恰对应AI的输入-输出-修正循环。程序员需将业务规则编码为机器可读标准,用工具链实现自动化验证,未来核心竞争力在于评估能力而非代码产量。
智能时空思考Agent|面向LBS场景的需求感知Agent构建实践
智能时空思考Agent通过LBS场景信号体系,构建需求感知的三层架构:L1锐度筛选,L2场景聚合,L3决策摘要。它从海量碎片化信号中提炼语义化上下文,还原完整决策逻辑,助力AI Agent主动服务用户需求,实现从被动响应到主动决策的跨越。
Using Claude Code: session management and 1M context
Claude Code的会话管理和上下文处理直接影响使用效果。百万token的大上下文窗口虽强,但过长会导致性能下降,称为"上下文腐化"。为解决这一问题,可通过重写、压缩、清理或创建子代理等方式优化上下文。合理使用这些功能,能有效避免冗余信息干扰,提升任务执行效率。使用时需根据任务特点选择合适策略,如连续任务保持会话,新任务则清理重启。
抽丝剥茧:深度解析 Hermes Agent 万字系统提示词(System Prompt)构成
Hermes agent的系统提示词结构复杂,包含身份定义、记忆指南、技能索引等模块,总字符数约36,700。通过优化AGENTS.md文件加载路径,可减少50%的tokens消耗,提升效率。技能索引虽丰富,但需警惕Skill泛滥问题。系统提示词的合理调整能显著提升Hermes的性能表现。