话题AI产品 › Claude

AI产品:Claude

关联话题: Anthropic、sonnet 3.5、sonnet 3.7、sonnet 4、opus 4、opus 4.1

How to 10x your Claude Skills (using Karpathy's autoresearch method)

小编带你了解如何利用Karpathy的autoresearch方法提升Claude技能。该方法通过AI代理自动测试和改进技能,无需手动干预。只需设定评分标准,代理会不断调整技能提示,直至达到最佳效果。例如,落地页文案技能通过此方法从56%通过率提升至92%。适用于任何可评分技能,如网站速度、冷邮件和新闻稿等。快来试试,让你的技能自动优化!

你不知道的 Agent:原理、架构与工程实践

Agent架构的核心在于稳定的控制流和上下文管理,通过工具扩展、提示结构调整和状态外化实现新能力。Harness系统比模型本身更决定系统收敛,高质量验证和清晰目标不可或缺。上下文工程防Context Rot,分层管理信息和记忆,确保信号质量。工具设计遵循ACI原则,边界明确,参数防错。记忆分层管理,跨会话一致性关键。长任务靠状态外化,多Agent先有任务图和隔离再并行。评测系统出问题先修评测,Trace是排查前提。

你不知道的 Claude Code:架构、治理与工程实践

揭秘AI协作系统的六层架构设计,从上下文治理到工具链优化。200K上下文实际可用仅160K,MCP工具定义竟吃掉12.5%!技能(Skills)要短小精悍,子代理(Subagents)重在隔离执行。记住三要诀:CLAUDE.md写硬约束,Hooks做确定性校验,验证标准前置定义。附赠终端项目实战配置模板,/health命令一键诊断系统健康度。

写 skill 全靠感觉?新版 skill-creator 用数据说话

新版skill-creator技能升级为评估驱动的迭代框架,新增多代理评估系统、基准测试防过拟合和描述触发优化三大能力。通过7步工作流实现技能创建到优化的闭环,包括意图捕获、需求采访、技能编写、测试用例、运行评估、改进优化和描述优化。评估环节采用Grader、Comparator、Analyzer三代理分工,确保客观性。最终通过可视化审查和反馈迭代持续提升技能质量,实测显示使用技能后通过率提升13.3%。

Lessons from Building Claude Code: How We Use Skills

Claude Code中的技能是灵活且易于创建的扩展点,不仅包含文本文件,还可包含脚本、数据等。技能可分为多种类型,如库使用指南、代码验证、数据连接等。编写技能时,应注重“陷阱”部分,利用文件夹结构进行渐进式披露。技能可通过共享或插件市场分发,依赖管理尚需手动处理。技能的使用情况可通过日志监控,持续迭代优化技能是关键。

兄弟!你真的懂 Skill 吗?

Anthropic的Skill系统通过SKILL.md和skill_run沙箱实现AI能力的灵活调用,而非依赖function calling。系统支持五种执行模式:纯Prompt注入、脚本执行、库调用、参考文档渐进加载和编排型。SKILL.md作为核心,既是使用手册也是知识传递工具,LLM通过阅读SKILL.md自主决定执行方式。skill_run则提供安全隔离的执行环境,支持多种语言和命令,极大提升了AI的任务处理能力。

Writing a good CLAUDE.md

LLM本质上是无状态的,每次会话开始时都需重新了解代码库。CLAUDE.md文件用于向Claude介绍项目的技术栈、结构和目的,内容应简洁且普遍适用。过多的指令会降低模型性能,建议采用逐步披露原则,将任务相关指令放在单独文件中。避免在CLAUDE.md中放入代码风格指南,应使用专门的格式化工具。CLAUDE.md是最高效的切入点,需精心设计,不建议自动生成。

Ralph Wiggum as a "software engineer"

Ralph 是一种基于 Bash 循环的 AI 技术,用于自动化软件开发。它通过循环执行单一任务,逐步构建项目,并能自动调整和改进。Ralph 在处理绿野项目时表现出色,尤其适用于新编程语言的开发。尽管存在缺陷,但通过提示调整和子代理的并行处理,Ralph 可以高效完成复杂任务。Ralph 的核心在于其确定性错误处理和非确定性世界的适应性,展现了 AI 在软件开发中的潜力。

Lessons from Building Claude Code: Seeing like an Agent

构建AI代理工具的核心在于根据模型能力定制动作空间,就像解数学题需要匹配计算工具一样。团队通过Claude Code开发发现:工具设计需不断迭代,例如从Todo清单升级为支持多代理协作的Task工具;搜索功能从被动RAG转为主动Grep查询;采用渐进式披露让模型自主构建上下文。关键洞察是——优秀工具要适配模型当前认知水平,且需持续观察模型行为来优化,没有放之四海皆准的模板。

Skills 真的可以帮我干活了:把工单分析变成一个可复用的 Skill

Claude Code 2.1.3版本合并了commands和skills,解决了触发难题。通过将企业内部SOP沉淀为Skills,实现工单自动化分析。采用Copy as fetch和agent-browser eval技术,绕过页面操作,直接获取接口数据,提升稳定性与效率。Skills以Markdown格式存在,自然语言编排,灵活适配不同角色需求,降低复杂UI脚本维护成本,真正替代重复性SOP脑力工作。

揭秘 Claude Code 前沿技巧与 Qoder CLI 日常开发实战

Claude Code 的核心能力拆解来啦!Command、Subagent、Skills 三大法宝各显神通:Command 是快捷指令,Subagent 像专业小助手,Skills 打包知识库。还有 Programmatic Tool Calling 黑科技,动态加载工具省内存。Qoder CLI 更接地气,本地审查、云端运维、Spec 开发全搞定,自然语言就能玩转代码。AI 开发新范式,效率直接拉满~

How we rebuilt Next.js with AI in one week

Cloudflare工程师用AI一周重构Next.js,推出基于Vite的替代框架vinext。它兼容Next.js API,构建速度快4倍,客户端包体积缩小57%,支持一键部署到Cloudflare Workers。vinext采用Vite架构,测试覆盖率94%,已投入生产环境。AI辅助开发成本仅1100美元,展现了AI重构复杂系统的潜力。

A Broken Heart

一个网页加载慢10倍,排查发现竟是Safari渲染彩色emoji的锅!作者用AI助手层层拆解,最终锁定罪魁祸首——Noto彩色表情字体在Safari下会触发1600ms的离奇布局延迟。简单移除emoji或改用苹果原生字体即可百倍提速,堪称"一行代码优化"的魔幻案例。AI虽帮倒忙引入问题,但逆向排查时真香!

灵码+Qwen3-Coder——使用Skill机制实现代码审核

Claude Skills通过动态加载专业知识,实现AI从通用助手到领域专家的无缝切换。其核心是基于提示词的上下文注入与元工具架构,而非传统的外部函数调用。每个Skill包含SKILL.md、脚本、参考文档和资源文件,Claude通过纯LLM推理选择并加载技能。灵码中可通过openskills方案实现Skill能力,如代码审核Skill,自动生成HTML报告,提升代码质量与安全性。Skills适用于高频重复任务、团队标准化、复杂工作流和知识沉淀,未来或形成垂直领域技能市场。

如何高效的长时间运行智能体

长时间运行智能体面临跨会话衔接难题,Claude Agent SDK采用双层方案应对。初始化智能体搭建环境、明确目标,编码智能体推进工作并留下清晰痕迹。通过功能列表、Git管理和自动化测试,智能体能稳定推进复杂任务,避免一次性做太多或过早宣布完成。未来可探索多智能体分工及更广泛的应用场景。

深度解析:Claude Code Cowork

Anthropic推出"Claude Code Cowork",标志着从模型提供商向代理生态系统协调者的转型。该产品包含三层架构:面向开发者的终端界面、普通用户的图形界面和企业集成的SDK,通过控制运行环境抵御模型商品化。Cowork采用虚拟化技术确保安全,支持非技术用户完成复杂任务。同时,Anthropic收紧第三方访问,保护核心知识产权。这一战略将AI竞争从单纯模型能力扩展到完整工具链生态。

trang chủ - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.0. UTC+08:00, 2026-03-22 05:35
浙ICP备14020137号-1 $bản đồ khách truy cập$