AI工程:Prompt Engineering
Harness Engineering:耗时一周,我是如何将应用的AI Coding率提升至90%的
AI编码正经历第三次范式跃迁,从Prompt Engineering到Context Engineering,再到Harness Engineering。Harness Engineering通过设计约束机制、反馈回路和工作流控制,解决了AI代码在企业级项目中的认知负担和质量控制问题。通过构建Harness体系,AI代码率从25%提升至90%,实现了高质量的可控输出。Harness的本质是外部化的质量保障体系,确保AI错误可控、可发现、可修复。未来,Harness将朝着自我进化、跨项目模板化和更精细的Agent角色矩阵方向发展。
深度解析与业务实战:将 screenshot-to-code 改造为支持 React + Ant Design 的前端利器
大语言模型驱动的代码生成智能体正在重塑软件开发范式,具备自主性、任务范围扩展和工程实践性增强三大特征。Github Copilot、Cursor等工具展现了广泛应用潜力。screenshot-to-code项目通过视觉解析、DOM结构推导和代码生成,实现设计稿到代码的转化。团队将其改造为支持React + Ant Design,优化提示词和后端处理,提升工程化适配和开发效率。后续将集成状态管理、交互逻辑推导和响应式适配,扩展组件库支持。
AI Coding 入门指南 - 如何更好地让AI真正帮你干活
AI编程的核心在于合理构建上下文,通过Spec Coding明确需求边界,结合Rules约束代码规范,用Skills封装可复用任务。模型能力有限,需前置整理需求避免误差放大。分步生成代码并Review,管理长对话上下文,及时重启纠正幻觉。工程化约束(Harness Engineering)能规模化提升AI协作效率,让开发者专注高价值决策而非机械编码。
基于 Harness + SDD + 多仓管理模式的 AI 全栈开发实践
AI全栈开发核心在于"Harness思维":让AI模仿现有代码实现而非从零创造,确保风格统一与高复用率。搭建多仓工作区结合Codebase Indexing,实现前后端代码的语义关联与接口对齐。通过SDD文档驱动开发流程,明确技术方案与任务拆分,借助多Agent并行生成前后端代码。采用三阶段验证策略(Mock测试、后端构建、联调)提升效率,同时警惕SDD未明示的隐性功能。该方法可显著提升代码采纳率,降低50%+开发耗时。
淘宝AI试穿全栈突破:超越GPT Image/Banana,已全量上线,Benchmark开源
淘宝AI试穿新突破!Tstars-Tryon 1.0以超低成本(仅为竞品1%)和闪电速度(单件3.92秒)实现业界最强试穿效果,GSB评分碾压GPT-Image-2。独创MMDiT架构支持8大品类、6件服饰自由叠穿,复杂场景下仍保持高保真。全新Tstars-VTON评测基准覆盖465种服饰属性,实测显示模型在多件试穿中稳定性超群。目前已全量上线手机淘宝,用户可一键体验虚拟换装黑科技。
AI手工测试用例的实践进阶之路
传统手工测试用例面临信息碎片化、时间窗口压缩、个人经验依赖等问题。AI用例生成项目通过MVP验证方向,1.0阶段补齐输入解析、Prompt工程化等关键能力,最终沉淀为测试智能体平台。核心在于升级测试设计链路,实现多源输入协同、过程治理和资产闭环,提升覆盖质量与生成效率,推动测试工程体系智能化演进。
柚漫剧 AI全流程提效拆解---从单点提效到工程融合
柚漫剧团队通过AI赋能,打通“需求-设计-开发-测试”全链路智能闭环,构建Prompt友好型PRD、AI Coding基建等核心能力,实现产研模式从“人力驱动”向“AI驱动”的范式跃迁。AI辅助产品经理提效,设计师聚焦效果精修,研发实现设计即代码,测试升级为AI Agent,推动产研协作效率大幅提升。
Improving Deep Agents with Harness Engineering
AI编码助手从Top 30飙到Top 5,全靠"缰绳"调得好!通过自动化追踪分析失败案例,用系统提示、工具和中间件三大杠杆优化执行流程。关键操作:让AI自我验证代码,强制测试环节;预装环境上下文减少搜索失误;用"思考三明治"策略分配算力(高-低-高推理强度)。核心逻辑是给AI搭好脚手架,帮它避开当前模型的短板,比如死循环改代码或忽略测试。开源项目实测显示,这套方法论能让AI编程更靠谱!
From Products to Inspiration: Inside the Engine of Occasion-based outfit visualiser
在线购物体验迎来革新!传统商品页只展示单品,用户得脑补搭配效果。某平台推出"Looks"功能,用AI当私人造型师:先通过百万风格数据分析构建穿搭逻辑树,再用计算机视觉实现虚拟叠穿,最后用生成式AI打造带场景的时尚大片。更绝的是点击图片就能直接购买单品,把灵感瞬间变成订单。这波操作让冷冰冰的商品页变成了有温度的穿搭指南!
AI 辅助重构 20 万行代码:渐进式重建代码秩序
代码重构迫在眉睫!面对臃肿的代码库,AI成了得力助手。从拆解千行函数到引入策略模式,再到打造依赖注入和Pipeline架构,步步为营。通用组件沉淀让代码质量飙升,性能优化暗藏惊喜。AI虽强仍需人工把关,渐进式重构才是王道。技术债还清后,开发效率翻倍,团队战斗力直线上升!记住:好代码是长出来的,不是憋出来的~
深度解析 Claude Code 在 Prompt / Context / Harness 的设计与实践
Claude Code的设计哲学从Prompt、Context到Harness层层递进,构建了AI Coding Agent的顶级工程实践。其动态组装的System Prompt像搭积木般灵活,CLAUDE.md文件实现精准项目指引,三层压缩体系巧妙平衡记忆与效率。六大内置Agent各司其职,Verification Agent堪称代码质检官。精细的权限控制与沙箱隔离筑起安全防线,而异步生成器架构让长任务稳如磐石。彩蛋功能更展现Anthropic的工程浪漫,将严谨与趣味完美融合。
How we built our multi-agent research system
多智能体系统通过并行分工显著提升研究效率:主代理协调任务,子代理同步执行搜索,比单代理快90%。架构核心是动态任务分解与工具协同——主代理规划策略,子代理分头探索后汇总结果。关键技巧包括:1)提示工程需模拟代理思维,明确分工;2)工具设计要精准匹配任务;3)采用广度优先搜索策略。系统消耗15倍于聊天的算力,但对复杂查询效果显著,如准确抓取标普500公司董事会数据。错误处理采用断点续查机制,确保长时任务稳定性。
Prompt caching in LLMs, clearly explained
AI对话缓存技术揭秘:静态前缀(系统指令/工具定义)与动态后缀(对话记录)分离存储,通过KV缓存机制复用已计算的关键值向量,实现90%成本削减。以Claude代码助手为例,30分钟会话中92%的缓存命中率将200万token费用从6美元压至1.15美元。核心法则:保持前缀哈希稳定(不改工具/模型),动态内容严格后置,像处理CPU缓存一样设计提示词架构。
抽丝剥茧:深度解析 Hermes Agent 万字系统提示词(System Prompt)构成
Hermes agent的系统提示词结构复杂,包含身份定义、记忆指南、技能索引等模块,总字符数约36,700。通过优化AGENTS.md文件加载路径,可减少50%的tokens消耗,提升效率。技能索引虽丰富,但需警惕Skill泛滥问题。系统提示词的合理调整能显著提升Hermes的性能表现。
财务数仓 Claude AI Coding 应用实战
财务数仓领域面临高复杂度与低容错率挑战,AI大模型通过超大上下文窗口、业务语义理解和规范执行力,显著提升效率。AI应用于OneData标准化建模、SQL Coding、数据测试和需求文档转换等场景,实现从单点提效到全链路增强的转变,优化人机协作模式,推动财务数仓智能化发展。
深度解析 OpenClaw 在 Prompt / Context / Harness 三个维度中的设计哲学与实践
OpenClaw作为AI Agent领域的标杆,其设计精髓在于三大维度:Prompt Engineering通过动态组装和Markdown驱动实现高效指令;Context Engineering借助Skills机制、压缩算法和双层记忆管理优化上下文;Harness Engineering则通过钩子、沙箱和约束机制确保可控性。这套架构为构建稳定、高效的Agent系统提供了可复用的方法论,值得深入学习和借鉴。