AI工程:AI Agent
AI Agent 是通过工程化的手段,为大语言模型提供了获取外部工具、知识的能力。他是介于人类、大语言模型之间的代理。当用户向 AI Agent 输入问题时,AI Agent 可以使用大语言模型作为推理引擎,将一个复杂的任务进行分解、给出任务执行规划。之后 Agent 会调用外部工具获取结果,并将大语言的上次推理和工具调用结果返回给大语言模型,让大语言模型继续思考、规划。如此循环,直到将一个复杂的任务完成。
Dark Code
系统行为越来越难被完整解释,运行时组件交互产生的"暗黑代码"成为常态。AI代理动态调用工具、自然语言作为控制层,导致执行路径无法预判,数据泄露和权限混乱频发。开发速度远超理解能力,安全审计形同虚设。非技术人员也能通过简单描述生成生产环境行为,但追责机制仍集中在少数人手中。传统SOC2认证已失效,企业亟需构建能实时回答"3月某周二系统对数据做了什么"的基础设施。
面向Skills编程:用领域知识工程驱动 Code Agent
阿里妈妈团队通过构建领域知识工程体系,解决Code Agent在复杂业务中的瓶颈问题。采用Skill三级架构渐进式加载知识,结合四层防腐机制确保知识不腐化。实践表明,显式映射领域知识与代码流程可提升准确率至90%以上。相比SDD,持续维护核心领域知识体系更高效。未来将聚焦知识深度,为Code Agent提供精准支持。
Building a Multi-agent Book Writer Using Qwen 3
AI写书神器上线!用3-5个词就能生成2万字电子书,技术栈包括Firecrawl爬虫、CrewAI编排和本地部署的Qwen 3大模型。工作流分三步:先通过关键词搜索自动生成目录大纲,再让多AI并行撰写各章节,最后整合成书。实测"Astronomy in 2025"主题仅需2分钟完稿,完整代码已在LightningAI平台开源。
2026 年 AI 编码的“渐进式 Spec”实战指南
AI编码实践聚焦大模型能力与Agent自主行动,强调Spec Coding规范与渐进式流程设计。通过分层架构与工具编排,优化编码效率与质量。核心在于知识积累与流程迭代,确保AI辅助编码的高效与安全。
OpenClaw: The complete guide to building, training, and living with your personal AI agent
OpenClaw是一款开源的个人AI助手,能够通过消息平台(如Telegram、WhatsApp等)接收指令,自主完成任务。它运行在本地或云端,支持多种技能和API,具备高度自主性。用户可通过终端安装OpenClaw,设置不同功能的AI代理,如个人助理、销售支持、社交媒体管理等,极大提升工作效率和生活便利性。尽管设置过程复杂,但其灵活性和强大的自动化能力使其成为个人AI工具的佼佼者。
OpenClaw-Observability:基于 DuckDB 构建 OpenClaw 的全链路可观测体系
OpenClaw的可观测插件通过DuckDB将AI Agent的执行过程结构化,解决了黑盒问题。插件在关键节点采集数据,建模并存储,最终展示为清晰的执行链路。这不仅让开发者能快速定位问题,还为系统优化提供了数据支持。插件的设计降低了接入门槛,支持本地和云上部署,确保AI系统的可靠性和可维护性。
Nanobot(OpenClaw 轻量实现)的底层原理解析
Nanobot是OpenClaw的轻量版,核心架构基于“提示词构建 + 调用大模型 + 工具操作”的循环执行模式。它通过消息处理、上下文构建、循环决策与工具调用等流程,实现本地Agent的高效运行。Nanobot开放了本地权限,允许大模型动态生成并执行脚本,突破了云端Agent的能力边界,提供了更强的专属感和可玩性。
IMClaw:通过微信/飞书操控ClaudeCode/Codex/GeminiCLI/Pi Agent蜂群
IMClaw是一款支持ACP协议的开源AI Agent网关,通过微信、飞书等IM工具远程操控ClaudeCode、Codex等AI Agent在服务器上工作。它解决了远程服务器使用AI助手的痛点,支持多Agent统一管理和安全认证,简化了配置流程,提升了协作效率。IMClaw轻量易部署,支持会话管理和权限控制,适用于AI编程助手、自动化运维等场景。
淘宝营销会场智能测试平台的AI落地实践
淘宝营销会场智能测试平台通过LLM与多模态Agent技术,实现"所见即所得"渲染校验、价格内容一致性比对等自动化检测,覆盖需求提测到线上回归全流程。该方案将传统人工测试升级为AI智能判定,问题发现率提升82%,测试人效翻倍,整体效率提高40%。未来将聚焦需求意图识别、AI造数等深度智能化方向,推动测试领域从规则驱动转向AI自治。
逆向深扒Claude Code源码,我发现了什么!?
Claude Code的核心在于12层渐进式工程包装,将基础Agent Loop升级为工业级编码代理。其架构围绕极简的while-true循环展开,通过工具层和包装层处理复杂性,实现多代理协作、按需知识注入和智能上下文压缩。权限系统四层防御、分层prompt缓存等设计彰显工程智慧,而Planning机制使任务完成率直接翻倍。未来将向全自主代理模式演进,展现AI编码助手的平台化潜力。
真正的工程之美:Claude Code 源码读后感
Claude Code的强大在于精巧的工程设计,而非模型本身。它通过六层上下文管理、草稿纸式推理、缓存架构、推测执行和对抗式验证,将模型能力放大。这些设计确保了长对话不丢信息,思考过程不占空间,并行任务几乎零成本,还能提前预测用户需求。工程让AI从聊天接口升级为复杂项目的协作者,展现了模型之外的无限潜力。
Agent Skills:打通可复用专业领域知识的最后一公里
AI技能包(Agent Skills)正在重塑人机协作模式!通过标准化文件封装专业知识,让大模型秒变领域专家。只需一个文件夹(含指令、脚本、模板),就能实现财务报税、代码周报等场景的"开箱即用"。技能生态爆发式增长,像Docker一样可组合、可版本控制,开发者能像搭积木般调用10万+技能。这波变革让AI从"纸上军师"进化为"实干搭档",终端直连工作流,真正释放生产力。
一文讲透如何构建Harness——六大组件全解析
【AI Agent工程新范式】
裸模型四大硬伤:失忆、代码不能跑、知识过期、无工作环境。Harness六大组件破局:文件系统管存储、沙箱执行自验证、AGENTS.md动态注入知识、Web搜索突破信息时效、上下文工程防信息过载、编排+Hooks保障多Agent协作。核心公式:Agent=模型+Harness——模型决定下限,工程化套件定义上限。2025年趋势表明,AI落地的关键不在模型参数,而在如何用Harness将智能转化为生产力。
What you can learn and copy from the 500,000 line Claude Code leak
Claude Code的源码泄露揭示了Anthropic在AI模型行为控制、安全防护和用户体验优化上的深度策略。系统提示精准引导模型行为,避免过度抽象和虚假报告;安全机制细致入微,防御Zsh攻击和秘密泄露;用户体验设计巧妙,如Tamagotchi伙伴和随机加载动词,提升趣味性。此外,Anti-Distillation技术通过注入虚假工具防御竞争对手模型训练,展现了AI产品的前瞻性防御思维。这些细节体现了Anthropic在AI产品开发中的高水准和深度思考。
AI 工程的真实代价:从 Claude Code 泄露源码看新模型接入的工程现实
Claude Code源码泄露揭示了AI工程的核心困境:新模型接入成熟系统的代价远超预期。反蒸馏技术通过三层防线保护模型能力,而缓存优化和流式解析则展现了系统性能的精细权衡。模型行为的边界案例暴露了行为退化和签名不兼容等问题,工程师通过最小化补丁逐个封堵。这些案例反映了模型能力进步与系统复杂性增长的矛盾。
一文了解 Anthropic 的 Claude Code 源码:为什么它就是比别人好用?
Claude Code被曝51万行源码,揭露三大核心设计:1)动态组装7层提示词系统,工具手册直喂AI;2)42个工具按需加载,fail-closed安全机制确保"先读后改"铁律;3)蜂群架构+记忆蒸馏,子Agent严格分层执行。这哪是编程工具?分明是用LLM当内核的操作系统!安全审查占90%代码量,Anthropic用极端工程化实现"无笼信任"。