话题AI工程 › Prompt Engineering

AI工程:Prompt Engineering

关联话题: 提示词

让AI变成Super员工的秘密:高效训练Skills

AI虽聪明,却在复杂任务中常表现不稳,根源在于缺乏“业务SOP”。通过web-testing Skill的打造,发现关键在于将AI从通用模型训练为懂业务、会自检、能稳定交付的S级员工。训练过程中,需明确触发条件、必做动作、自检方式及门禁规则,确保AI在复杂任务中不遗漏、不偷懒,最终实现稳定可靠的业务闭环交付。

I Read Hermes Agent's Memory System, and It Fixes What OpenClaw Got Wrong

Hermes Agent构建了一个高效的内存系统,包含四个层次:小型提示内存、可搜索的会话存档、代理管理的技能和可选的深层用户建模。核心设计是将提示保持稳定以优化缓存,其他信息通过工具按需检索。Hermes通过精简的内存文件和SQLite数据库管理历史会话,确保高效检索和总结。这种分层设计使得记忆系统既实用又经济,显著提升了代理的响应速度和成本效益。

从上下文工程到 Harness Engineering

AI Coding虽提升代码生成速度,但未解决测试、验证等非编码工作,导致研发更累。Harness Engineering通过构建Agent专属工具链,让AI接管全生命周期任务,打破70%非编码流程枷锁。工程师角色从编码者转向设计环境,提升Agent可读性,实现受控执行,释放人类创造力。

拒绝重复造轮子!抽象 80% 工作场景,打造可复用的"AI 助手工厂”

AI助手开发常陷入重复造轮子困境,智空间团队将80%高频场景抽象为四大类:复杂指令、知识问答、问题排查和极简场景,并针对每类设计可复用技术方案。通过Prompt插拔架构和分层解耦系统,实现业务方"配"而非"开发"助手。平台沉淀四大模板,内置框架Prompt与业务定制接口,显著降低开发门槛,让专家专注经验沉淀,推动AI应用从"作坊"迈向"工厂"模式。

你不知道的 Claude Code:架构、治理与工程实践

揭秘AI协作系统的六层架构设计,从上下文治理到工具链优化。200K上下文实际可用仅160K,MCP工具定义竟吃掉12.5%!技能(Skills)要短小精悍,子代理(Subagents)重在隔离执行。记住三要诀:CLAUDE.md写硬约束,Hooks做确定性校验,验证标准前置定义。附赠终端项目实战配置模板,/health命令一键诊断系统健康度。

How we optimized Dash's relevance judge with DSPy

Dropbox Dash利用DSPy框架优化AI相关性评估系统,通过自动化提示调优提升模型与人类判断的一致性。实验显示,优化后模型在成本降低的同时,评分误差减少45%,JSON格式错误率下降97%。该系统支持快速适配新模型,兼顾生产环境稳定性和大规模标注需求,显著提升了搜索排序和训练数据生成的质量。

被 Karpathy 下场推荐的 NanoClaw 是什么来头

OpenClaw一夜爆红,成为GitHub最受欢迎开源项目,其IM远程操控电脑的AI助手形态满足了大众对Jarvis的幻想。NanoClaw则以其小巧易懂、容器隔离安全的特点,被Karpathy推荐。两者各有优势,OpenClaw功能全面但安装复杂,NanoClaw安装简便且安全,但生态尚不完善。Claws项目虽前景广阔,但技术护城河浅,未来面临激烈竞争。

AI Coding前端实践后的复盘总结

AI Coding在前端开发中展现显著效率,尤其在样板代码生成和UI组件搭建上。然而,复杂业务逻辑和样式细节仍需人工干预。通过优化提示词、建立知识库和严格代码审查,团队提炼出“人机协同”最佳工作流,提升研发速度与质量。AI Coding工具虽便捷,但依赖高质量Prompt和知识库,未来需加强AI驱动的代码审查体系建设,确保智能化开发的可持续性。

兄弟!你真的懂 Skill 吗?

Anthropic的Skill系统通过SKILL.md和skill_run沙箱实现AI能力的灵活调用,而非依赖function calling。系统支持五种执行模式:纯Prompt注入、脚本执行、库调用、参考文档渐进加载和编排型。SKILL.md作为核心,既是使用手册也是知识传递工具,LLM通过阅读SKILL.md自主决定执行方式。skill_run则提供安全隔离的执行环境,支持多种语言和命令,极大提升了AI的任务处理能力。

基于 Cursor Agent 的流水线 AI CR 实践

AI代码审查(CR)能自动检测代码质量问题,弥补人工审查的不足。前端开发中,AI CR通过流水线自动触发,生成报告并引导开发者优化代码。Cursor Agent CLI集成到流水线中,提供高效、低误报的CR解决方案。内置提示词工程和模型选择进一步提升了审查效率和准确性,推动AI CR在现代开发流程中的应用和普及。

Snowsky Echo Mini 固件逆向背后的故事

小编摘要:作者沉迷复古音乐设备,吐槽飞傲Echo Mini MP3的烂UI,用大语言模型逆向魔改固件,从字库提取到刷机工具开发全程AI辅助,意外掀起玩家社区改机热潮。过程中发现LLM协作的智能与陷阱——高频反馈像老虎机让人停不下来,也预示未来"脚本小子"门槛将暴跌。最后设备变砖又被AI救活,堪称一场技术宅的奇幻漂流。

Improving Deep Agents with harness engineering

通过优化编码代理的“套件”,我们将其在Terminal Bench 2.0的表现从Top 30提升至Top 5。核心在于自我验证与追踪技术,帮助代理更好地完成任务。我们调整了系统提示、工具和中间件,增强了代理的自我验证能力,使其在构建、验证和修复过程中更加高效。此外,我们还为代理提供了环境上下文,帮助其更好地理解任务要求,避免陷入无效循环。这些改进显著提升了代理的性能,展示了套件工程在优化模型任务表现中的重要作用。

Skills开发技能指南:OpenClaw也好,Skills也好,都别脱离具体场景谈方案

AI时代,Prompt复用催生了Skills的诞生——它们本质是高频公共指令的封装,像中台一样提升效率。关键在于"恰好而非更多":精准匹配需求,避免信息过载。开发Skills需结合归纳法(提炼经验)和演绎法(应用规律),核心在于洞察问题本质。实践层面,逆向建模、问题定位和AI辅助CR展现了Skills的威力:用结构化思维拆解需求,让AI按"图纸"精准编码。记住,Skills的价值在于解决具体问题,盲目堆砌只会适得其反。

一文搞懂爆火的SKills原理及实践案例

Skills的形成源于中台思维,强调复用与效率。通过将高频Prompt封装成Skills,实现快速调用与流程优化。Skills设计需遵循“恰好而非更多”原则,避免信息过载。经验沉淀得益于AI对文字的理解,使知识与技能得以高效共享与复用。开发Skills需结合归纳法与演绎法,洞察问题并提炼解决方案,推动AI时代系统设计的转型。

Lessons from Building Claude Code: Prompt Caching Is Everything

提示词缓存是降低AI代理成本与延迟的核心,前缀匹配机制决定缓存命中率。关键经验:静态内容前置、动态后置;用消息更新而非修改系统提示;避免中途增减工具或切换模型;监控缓存命中率如运维系统。压缩会话时需复用父会话前缀,工具延迟加载保持缓存稳定。设计功能时需优先考虑缓存约束,如"计划模式"通过工具调用而非切换工具集实现。

Unified Context-Intent Embeddings for Scalable Text-to-SQL

Pinterest构建了一个智能分析代理,通过统一上下文意图嵌入和结构化统计模式,将历史查询转化为可搜索的知识库。该系统结合语义检索与治理感知排名,确保生成的SQL基于已验证模式。AI自动生成文档和基于联动的术语传播大幅降低了人工维护成本,而向量数据库服务支撑了高效检索。最终打造的分析助手能理解业务问题,推荐可靠数据资产并生成高质量SQL,形成自我强化的学习循环。

trang chủ - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.0. UTC+08:00, 2026-03-24 06:43
浙ICP备14020137号-1 $bản đồ khách truy cập$