话题AI产品 › Claude

AI产品:Claude

关联话题: Anthropic、sonnet 3.5、sonnet 3.7、sonnet 4、opus 4、opus 4.1

Building agents with the Claude Agent SDK

Claude Agent SDK让AI像人类一样操作电脑,从代码工具升级为通用智能体框架。核心思路是赋予AI文件读写、终端操作等基础能力,支持构建金融、客服、研究等各类智能体。开发关键在"收集上下文-执行动作-验证结果"的循环:通过文件系统、语义搜索获取信息,利用工具和脚本执行任务,再借助规则检查、视觉反馈等方式验证输出。这套方法论让智能体能自主迭代,处理复杂工作流。

Building a C compiler with a team of parallel Claudes

Anthropic研究员用16个Claude智能体并行开发,成功打造了一个能编译Linux内核的Rust版C编译器!全程无人工干预,耗时两周、花费2万美元,产出10万行代码,支持x86/ARM/RISC-V架构。虽然生成的代码效率不如GCC,但已能编译SQLite/Redis等主流软件,甚至能跑DOOM!这波操作展示了AI团队协作的惊人潜力,但也暴露出模型在复杂任务中的天花板。项目代码已开源,堪称AI自主编程的里程碑实验~

How I Built Vue Lynx with AI in Two Weeks

Vue Lynx横空出世!开发者仅用37小时周末hackathon打通Vue与Lynx双线程架构,让Vue代码在后台线程运行,UI操作主线程零延迟交互。现已支持Composition API、Vue Router等核心生态,提供20+跨平台示例。通过AI自动化测试验证852项上游测试,采用差异对比法确保HackerNews等复杂应用完美移植。只需npm create vue-lynx@latest即可体验这份让Vue轻松跑在原生端的黑科技~

Claude Code auto mode: a safer way to skip permissions

Claude Code的自动模式通过双层防御机制提升安全性:输入层使用提示注入探测,输出层采用转录分类器。分类器分两阶段工作,快速过滤后再进行链式思考,降低误报率。该模式旨在减少手动批准疲劳,同时防止过度活跃行为和提示注入等威胁。尽管存在17%的误放率,但相较无权限检查的模式,安全性显著提升。自动模式适用于低风险任务,但不替代高安全性场景下的手动审查。

讲透Claude Code架构一篇就够:上下文、治理与工程实践

Claude Code的六层模型揭示其运转机制,上下文管理是关键。CLAUDE.md需简洁,避免污染上下文。工具设计应优化正确选择和使用,Skills提供按需加载的工作流。Subagent用于隔离执行,Hooks确保确定性流程。验证层级确保任务正确完成。Prompt Caching降低成本,提升延迟。工程实践中,收敛状态再暴露编辑入口,避免不必要的混乱。

Harness design for long-running application development

探索AI在多领域应用的潜力,通过设计生成器与评估器的多代理架构,提升Claude在前端设计和全栈开发中的表现。评估器基于具体标准反馈,生成器迭代优化,实现高质量输出。模型自主编码时,采用任务分解和上下文重置策略,确保连贯性。实验证明,分离生成与评估流程能显著提升应用质量和创意表达。

龙虾盛宴下的冷思考

AI工具的流行带来了新的职业和工具断货现象,但很多人使用后不知如何有效利用。AI编程工具虽提升了效率,但存在代码质量不高、伪需求等问题。关键在于找到真实需求,避免自我感动,合理利用AI工具而非盲目依赖。认清瓶颈,谨慎应对认知陷阱,按特长分工使用不同模型,才能让AI真正助力工作。

How to 10x your Claude Skills (using Karpathy's autoresearch method)

小编带你了解如何利用Karpathy的autoresearch方法提升Claude技能。该方法通过AI代理自动测试和改进技能,无需手动干预。只需设定评分标准,代理会不断调整技能提示,直至达到最佳效果。例如,落地页文案技能通过此方法从56%通过率提升至92%。适用于任何可评分技能,如网站速度、冷邮件和新闻稿等。快来试试,让你的技能自动优化!

你不知道的 Agent:原理、架构与工程实践

Agent架构的核心在于稳定的控制流和上下文管理,通过工具扩展、提示结构调整和状态外化实现新能力。Harness系统比模型本身更决定系统收敛,高质量验证和清晰目标不可或缺。上下文工程防Context Rot,分层管理信息和记忆,确保信号质量。工具设计遵循ACI原则,边界明确,参数防错。记忆分层管理,跨会话一致性关键。长任务靠状态外化,多Agent先有任务图和隔离再并行。评测系统出问题先修评测,Trace是排查前提。

你不知道的 Claude Code:架构、治理与工程实践

揭秘AI协作系统的六层架构设计,从上下文治理到工具链优化。200K上下文实际可用仅160K,MCP工具定义竟吃掉12.5%!技能(Skills)要短小精悍,子代理(Subagents)重在隔离执行。记住三要诀:CLAUDE.md写硬约束,Hooks做确定性校验,验证标准前置定义。附赠终端项目实战配置模板,/health命令一键诊断系统健康度。

写 skill 全靠感觉?新版 skill-creator 用数据说话

新版skill-creator技能升级为评估驱动的迭代框架,新增多代理评估系统、基准测试防过拟合和描述触发优化三大能力。通过7步工作流实现技能创建到优化的闭环,包括意图捕获、需求采访、技能编写、测试用例、运行评估、改进优化和描述优化。评估环节采用Grader、Comparator、Analyzer三代理分工,确保客观性。最终通过可视化审查和反馈迭代持续提升技能质量,实测显示使用技能后通过率提升13.3%。

Lessons from Building Claude Code: How We Use Skills

Claude Code中的技能是灵活且易于创建的扩展点,不仅包含文本文件,还可包含脚本、数据等。技能可分为多种类型,如库使用指南、代码验证、数据连接等。编写技能时,应注重“陷阱”部分,利用文件夹结构进行渐进式披露。技能可通过共享或插件市场分发,依赖管理尚需手动处理。技能的使用情况可通过日志监控,持续迭代优化技能是关键。

兄弟!你真的懂 Skill 吗?

Anthropic的Skill系统通过SKILL.md和skill_run沙箱实现AI能力的灵活调用,而非依赖function calling。系统支持五种执行模式:纯Prompt注入、脚本执行、库调用、参考文档渐进加载和编排型。SKILL.md作为核心,既是使用手册也是知识传递工具,LLM通过阅读SKILL.md自主决定执行方式。skill_run则提供安全隔离的执行环境,支持多种语言和命令,极大提升了AI的任务处理能力。

Writing a good CLAUDE.md

LLM本质上是无状态的,每次会话开始时都需重新了解代码库。CLAUDE.md文件用于向Claude介绍项目的技术栈、结构和目的,内容应简洁且普遍适用。过多的指令会降低模型性能,建议采用逐步披露原则,将任务相关指令放在单独文件中。避免在CLAUDE.md中放入代码风格指南,应使用专门的格式化工具。CLAUDE.md是最高效的切入点,需精心设计,不建议自动生成。

Ralph Wiggum as a "software engineer"

Ralph 是一种基于 Bash 循环的 AI 技术,用于自动化软件开发。它通过循环执行单一任务,逐步构建项目,并能自动调整和改进。Ralph 在处理绿野项目时表现出色,尤其适用于新编程语言的开发。尽管存在缺陷,但通过提示调整和子代理的并行处理,Ralph 可以高效完成复杂任务。Ralph 的核心在于其确定性错误处理和非确定性世界的适应性,展现了 AI 在软件开发中的潜力。

Lessons from Building Claude Code: Seeing like an Agent

构建AI代理工具的核心在于根据模型能力定制动作空间,就像解数学题需要匹配计算工具一样。团队通过Claude Code开发发现:工具设计需不断迭代,例如从Todo清单升级为支持多代理协作的Task工具;搜索功能从被动RAG转为主动Grep查询;采用渐进式披露让模型自主构建上下文。关键洞察是——优秀工具要适配模型当前认知水平,且需持续观察模型行为来优化,没有放之四海皆准的模板。

inicio - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.0. UTC+08:00, 2026-03-28 17:42
浙ICP备14020137号-1 $mapa de visitantes$