话题AI工程 › Prompt Engineering

AI工程:Prompt Engineering

关联话题: 提示词

Better Harness: A Recipe for Harness Hill-Climbing with Evals

构建智能体的关键在于优化控制框架(harness),而评估数据(evals)是核心驱动力。通过人工标注、生产日志挖掘和外部数据集构建高质量评估集,并分类标记以针对性优化。系统采用"优化集+保留集"双轨验证,结合自动化调整与人工审核,避免过拟合。实验显示,该方法能显著提升智能体工具调用和多步推理能力,同时通过版本追踪防止性能回退。未来将探索自动化错误检测与修复,形成"使用-反馈-优化"的增强闭环。

自掏腰包一万元,拥抱AI这一年,我的工具、实践和思考

AI时代,如何高效拥抱技术变革?从工具链迭代到Agent实践,分享实用方法论:MAC工具链优化、低垂果实采摘、Prompt到Harness的工程演进。更提出让AI代学代用,构建知识管理闭环。技术浪潮中,与其追逐每个风口,不如专注可沉淀的实践。与AI做朋友,在动态平衡中找到自己的节奏。

AI大模型辅助下的源代码项目-逆向工程和实践案例参考

这套AI逆向工程方案专为大型Java微服务项目设计,通过结构化YAML文档提取业务语义而非代码细节。采用五层方法论:总控层定方向,约束层防漂移,执行层标准化流程,任务层分对象建模,样例层提供参考。核心是"快速扫描+场景驱动",先建索引再下钻,产出业务域、功能、接口等11类文档,并通过交叉验证确保质量。方案特别适合文档缺失的存量系统,能快速构建AI可理解的业务模型。

智能代码审基于大语言模型的自动化代码质量保障平台设计与实践

这套AI代码审查系统基于GitLab Merge Request,自动化处理代码审查中的基础性、重复性工作。系统通过监听MR事件、解析代码Diff、调用大语言模型识别缺陷,并将结果回写到MR评论区。核心优化包括Diff行号映射、审查结果收敛、评论管理及高并发限流策略,确保审查结果准确、稳定,提升团队协作效率,减少人工审查负担。

AI数据工程师在应用中如何"返璞归真"

AI Agent构建需超越轻量级模式,面对知识质量、语义理解与规模化维护挑战。应从Prompt-Centric转向Context-Aware,构建结构化、可推理的上下文语料体系,提升语义对齐与工具集成标准化。通过本体建设与RAG升级,实现精准理解、可靠推理与高效执行,降低系统性幻觉,提升AI决策的可解释性与业务价值。

Components of A Coding Agent

编码代理通过工具使用、记忆管理和代码库上下文提升LLM在实际应用中的表现。核心在于代理循环、提示缓存、工具访问和上下文压缩等六大组件,使模型在编程任务中更高效。编码代理的设计优化了模型与环境互动,提升用户体验和任务连续性,使其比简单聊天界面更强大。

2026 年 AI 编码的“渐进式 Spec”实战指南

AI编码实践聚焦大模型能力与Agent自主行动,强调Spec Coding规范与渐进式流程设计。通过分层架构与工具编排,优化编码效率与质量。核心在于知识积累与流程迭代,确保AI辅助编码的高效与安全。

Nanobot(OpenClaw 轻量实现)的底层原理解析

Nanobot是OpenClaw的轻量版,核心架构基于“提示词构建 + 调用大模型 + 工具操作”的循环执行模式。它通过消息处理、上下文构建、循环决策与工具调用等流程,实现本地Agent的高效运行。Nanobot开放了本地权限,允许大模型动态生成并执行脚本,突破了云端Agent的能力边界,提供了更强的专属感和可玩性。

逆向深扒Claude Code源码,我发现了什么!?

Claude Code的核心在于12层渐进式工程包装,将基础Agent Loop升级为工业级编码代理。其架构围绕极简的while-true循环展开,通过工具层和包装层处理复杂性,实现多代理协作、按需知识注入和智能上下文压缩。权限系统四层防御、分层prompt缓存等设计彰显工程智慧,而Planning机制使任务完成率直接翻倍。未来将向全自主代理模式演进,展现AI编码助手的平台化潜力。

What you can learn and copy from the 500,000 line Claude Code leak

Claude Code的源码泄露揭示了Anthropic在AI模型行为控制、安全防护和用户体验优化上的深度策略。系统提示精准引导模型行为,避免过度抽象和虚假报告;安全机制细致入微,防御Zsh攻击和秘密泄露;用户体验设计巧妙,如Tamagotchi伙伴和随机加载动词,提升趣味性。此外,Anti-Distillation技术通过注入虚假工具防御竞争对手模型训练,展现了AI产品的前瞻性防御思维。这些细节体现了Anthropic在AI产品开发中的高水准和深度思考。

一文了解 Anthropic 的 Claude Code 源码:为什么它就是比别人好用?

Claude Code被曝51万行源码,揭露三大核心设计:1)动态组装7层提示词系统,工具手册直喂AI;2)42个工具按需加载,fail-closed安全机制确保"先读后改"铁律;3)蜂群架构+记忆蒸馏,子Agent严格分层执行。这哪是编程工具?分明是用LLM当内核的操作系统!安全审查占90%代码量,Anthropic用极端工程化实现"无笼信任"。

从 Vibe Coding 到范式编程:用 Spec 打造淘系交易的 AI 领域专家

AI编程正从“Vibe Coding”向“范式编程”演进,核心是通过结构化规范驱动AI生成企业级代码。当前AI工具因缺乏领域知识和规范约束,生成代码不可靠、难维护。范式编程将规范置于开发中心,结合知识库与AI Agent,构建可沉淀、复用的AI领域专家体系,实现人机协同的范式升级,提升代码质量和效率。

Grounding Enterprise AI with Live Web Retrieval and Verifiable Citations

AI工程师团队为Salesforce的Prompt Builder增强了外部数据检索和引用功能,让企业AI提示能动态整合实时网络信息并标注来源。通过创新架构设计,系统在保证安全性的同时,将网页检索能力直接嵌入提示流程,解决大语言模型数据滞后问题。当生成响应时,自动插入可追溯的引用标记,用户可点击验证信息来源,显著降低幻觉风险。工程实现上平衡了性能与准确性,采用逆向处理等技术优化长文本标注效率。

从零开始两天构建一个 Claude Code:带你拆解 AI CLI 的每一层

小编探索了构建生产级agentic CLI的关键技术,涉及SSE缓冲区管理、system prompt分段、工具权限拦截等。通过Claude Code为参照,实现了一个纯TypeScript的CLI,采用分层架构,核心流程包括用户输入处理、API调用、工具执行和结果反馈。技术选型依托Node.js 22原生能力,注重缓存优化和安全性,内置21个工具,支持插件扩展和多Agent协作,模拟跨会话记忆,确保高效与安全。

Claude在得物App数仓的深度集成与效能演进

Code LLM在电商数仓中的应用,推动了研发范式的升级。通过界定数据确权边界,AI辅助技术实现,确保合规与安全。规范化的输入输出契约,抑制了模型幻觉,提升了数据质量。Galaxy MCP的集成,使大模型能感知和操作企业数据环境,实现智能埋点、OneData建模、周报生成等场景的自动化。认知运行时与执行运行时的解耦,融合了语义理解与高效计算,推动数仓向智能化、自动化演进。

业务逻辑的“坍塌”:当应用层只剩下胶水代码,在 AI Agent 时代,我们该构建什么

AI开发从质疑到驾驭,揭秘大模型不确定性源于硬件异构与数值精度。Agent开发如同胶水层,需平衡Prompt工程、Context管理与工具编排。Transformer架构通过注意力机制实现语义理解,而算力与数据驱动其强大泛化能力。传统架构与AI融合面临概率性挑战,需重构业务流程。理解底层原理,方能高效驾驭AI潜能。

首页 - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.2. UTC+08:00, 2026-05-08 09:14
浙ICP备14020137号-1 $访客地图$