话题AI工程 › Prompt Engineering

AI工程:Prompt Engineering

关联话题: 提示词

业务逻辑的“坍塌”:当应用层只剩下胶水代码,在 AI Agent 时代,我们该构建什么

AI开发从质疑到驾驭,揭秘大模型不确定性源于硬件异构与数值精度。Agent开发如同胶水层,需平衡Prompt工程、Context管理与工具编排。Transformer架构通过注意力机制实现语义理解,而算力与数据驱动其强大泛化能力。传统架构与AI融合面临概率性挑战,需重构业务流程。理解底层原理,方能高效驾驭AI潜能。

Scaling Localization with AI at Lyft

Lyft通过AI重构翻译流程,结合LLM生成与评估,实现从多天到分钟的翻译速度,同时保障质量。系统分三个阶段:草稿生成、早期发布和最终审核。LLM处理上下文,生成多种翻译候选,评估模型筛选最优方案,并通过反馈迭代优化。引入术语表和防护机制,确保品牌术语和格式一致性。实验配置和多模型支持进一步提升效率和准确性,满足全球市场快速扩展需求。

Building a Magic Mirror: AI retail experiences with Remix

线上购物愈发便捷,实体店的价值转向体验化。AI魔镜应运而生,通过视觉识别和互动,为顾客提供个性化信息、产品推荐等,提升购物趣味性。魔镜核心由全尺寸镜子、摄像头和计算机组成,运行HTTP协议,实现快速互动。借助Remix框架,服务器和客户端逻辑统一,简化开发流程。魔镜可自定义,适用于多种场景,如美妆试色、互动挑战等,为品牌创造独特购物体验。

一套跑了 9 个月的全自动 AI 日报系统是怎么搭的:从数据采集到 AI 分析到三端分发,附完整 Prompt

这套全自动日报系统从数据采集到AI分析再到分发,实现了行业资讯的高效处理。通过三层解耦设计,系统稳定运行9个月,每天精准推送游戏和AI领域的Top 10精选。核心亮点包括:N8N+RSS实现数据采集标准化,三路并行LLM提速分析,智能分组去重技术,以及企微/GitHub/Wiki三端自动分发。实战经验证明,合理运用现有工具链,个人开发者也能搭建专业级信息处理系统。

让AI变成Super员工的秘密:高效训练Skills

AI虽聪明,却在复杂任务中常表现不稳,根源在于缺乏“业务SOP”。通过web-testing Skill的打造,发现关键在于将AI从通用模型训练为懂业务、会自检、能稳定交付的S级员工。训练过程中,需明确触发条件、必做动作、自检方式及门禁规则,确保AI在复杂任务中不遗漏、不偷懒,最终实现稳定可靠的业务闭环交付。

I Read Hermes Agent's Memory System, and It Fixes What OpenClaw Got Wrong

Hermes Agent构建了一个高效的内存系统,包含四个层次:小型提示内存、可搜索的会话存档、代理管理的技能和可选的深层用户建模。核心设计是将提示保持稳定以优化缓存,其他信息通过工具按需检索。Hermes通过精简的内存文件和SQLite数据库管理历史会话,确保高效检索和总结。这种分层设计使得记忆系统既实用又经济,显著提升了代理的响应速度和成本效益。

从上下文工程到 Harness Engineering

AI Coding虽提升代码生成速度,但未解决测试、验证等非编码工作,导致研发更累。Harness Engineering通过构建Agent专属工具链,让AI接管全生命周期任务,打破70%非编码流程枷锁。工程师角色从编码者转向设计环境,提升Agent可读性,实现受控执行,释放人类创造力。

拒绝重复造轮子!抽象 80% 工作场景,打造可复用的"AI 助手工厂”

AI助手开发常陷入重复造轮子困境,智空间团队将80%高频场景抽象为四大类:复杂指令、知识问答、问题排查和极简场景,并针对每类设计可复用技术方案。通过Prompt插拔架构和分层解耦系统,实现业务方"配"而非"开发"助手。平台沉淀四大模板,内置框架Prompt与业务定制接口,显著降低开发门槛,让专家专注经验沉淀,推动AI应用从"作坊"迈向"工厂"模式。

你不知道的 Claude Code:架构、治理与工程实践

揭秘AI协作系统的六层架构设计,从上下文治理到工具链优化。200K上下文实际可用仅160K,MCP工具定义竟吃掉12.5%!技能(Skills)要短小精悍,子代理(Subagents)重在隔离执行。记住三要诀:CLAUDE.md写硬约束,Hooks做确定性校验,验证标准前置定义。附赠终端项目实战配置模板,/health命令一键诊断系统健康度。

How we optimized Dash's relevance judge with DSPy

Dropbox Dash利用DSPy框架优化AI相关性评估系统,通过自动化提示调优提升模型与人类判断的一致性。实验显示,优化后模型在成本降低的同时,评分误差减少45%,JSON格式错误率下降97%。该系统支持快速适配新模型,兼顾生产环境稳定性和大规模标注需求,显著提升了搜索排序和训练数据生成的质量。

被 Karpathy 下场推荐的 NanoClaw 是什么来头

OpenClaw一夜爆红,成为GitHub最受欢迎开源项目,其IM远程操控电脑的AI助手形态满足了大众对Jarvis的幻想。NanoClaw则以其小巧易懂、容器隔离安全的特点,被Karpathy推荐。两者各有优势,OpenClaw功能全面但安装复杂,NanoClaw安装简便且安全,但生态尚不完善。Claws项目虽前景广阔,但技术护城河浅,未来面临激烈竞争。

AI Coding前端实践后的复盘总结

AI Coding在前端开发中展现显著效率,尤其在样板代码生成和UI组件搭建上。然而,复杂业务逻辑和样式细节仍需人工干预。通过优化提示词、建立知识库和严格代码审查,团队提炼出“人机协同”最佳工作流,提升研发速度与质量。AI Coding工具虽便捷,但依赖高质量Prompt和知识库,未来需加强AI驱动的代码审查体系建设,确保智能化开发的可持续性。

兄弟!你真的懂 Skill 吗?

Anthropic的Skill系统通过SKILL.md和skill_run沙箱实现AI能力的灵活调用,而非依赖function calling。系统支持五种执行模式:纯Prompt注入、脚本执行、库调用、参考文档渐进加载和编排型。SKILL.md作为核心,既是使用手册也是知识传递工具,LLM通过阅读SKILL.md自主决定执行方式。skill_run则提供安全隔离的执行环境,支持多种语言和命令,极大提升了AI的任务处理能力。

基于 Cursor Agent 的流水线 AI CR 实践

AI代码审查(CR)能自动检测代码质量问题,弥补人工审查的不足。前端开发中,AI CR通过流水线自动触发,生成报告并引导开发者优化代码。Cursor Agent CLI集成到流水线中,提供高效、低误报的CR解决方案。内置提示词工程和模型选择进一步提升了审查效率和准确性,推动AI CR在现代开发流程中的应用和普及。

Snowsky Echo Mini 固件逆向背后的故事

小编摘要:作者沉迷复古音乐设备,吐槽飞傲Echo Mini MP3的烂UI,用大语言模型逆向魔改固件,从字库提取到刷机工具开发全程AI辅助,意外掀起玩家社区改机热潮。过程中发现LLM协作的智能与陷阱——高频反馈像老虎机让人停不下来,也预示未来"脚本小子"门槛将暴跌。最后设备变砖又被AI救活,堪称一场技术宅的奇幻漂流。

Improving Deep Agents with harness engineering

通过优化编码代理的“套件”,我们将其在Terminal Bench 2.0的表现从Top 30提升至Top 5。核心在于自我验证与追踪技术,帮助代理更好地完成任务。我们调整了系统提示、工具和中间件,增强了代理的自我验证能力,使其在构建、验证和修复过程中更加高效。此外,我们还为代理提供了环境上下文,帮助其更好地理解任务要求,避免陷入无效循环。这些改进显著提升了代理的性能,展示了套件工程在优化模型任务表现中的重要作用。

首页 - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.0. UTC+08:00, 2026-03-24 23:45
浙ICP备14020137号-1 $访客地图$