AI工程:AI Agent
AI Agent 是通过工程化的手段,为大语言模型提供了获取外部工具、知识的能力。他是介于人类、大语言模型之间的代理。当用户向 AI Agent 输入问题时,AI Agent 可以使用大语言模型作为推理引擎,将一个复杂的任务进行分解、给出任务执行规划。之后 Agent 会调用外部工具获取结果,并将大语言的上次推理和工具调用结果返回给大语言模型,让大语言模型继续思考、规划。如此循环,直到将一个复杂的任务完成。
用第一性原理拆解 Agentic Coding:从理论到实操(下)
与AI协作时,短对话比长对话更高效,应将复杂任务拆解为专注的小对话。优化开发者体验,如清晰文档和快速测试,既提升人类效率,也增强AI表现。AI协作是一门需刻意练习的技能,开发者可通过实践成为驾驭AI的“专家型通才”,在更广领域创造价值。
认知重建:Speckit 用了三个月,我放弃了——走出工具很强但用不好的困境
AI编程工具虽强大,但企业落地仍面临挑战。speckit和openspec的规范驱动开发在企业复杂场景中显得理想化,难以应对动态需求和历史经验。AI工程化通过上下文工程和复合工程理念,实现知识沉淀与复用,降低边际成本。Subagent架构和多Agent协作有效解决了上下文窗口爆满问题,提升了AI决策质量。未来,工具将逐渐隐形,AI协作将无缝融入工作流程。
高德发布STAgent:专为复杂时空规划而生的智能体
高德推出STAgent智能体,专注复杂时空推理任务。该模型在多重约束下优化行程规划,集成10种专业工具,结合SFT-Guided RL训练策略提升性能。实验显示,STAgent在TravelBench上表现优异,30B参数规模媲美235B级模型,兼具专业性与通用能力,为智能体规划领域提供了高效解决方案。
从HITL(Human In The Loop) 实践出发看Agent与设计模式的对跖点
ReactAgent引入HITL机制实现人机协同,通过交互设计和对话挂起保持连续性,解决参数不明确时的任务控制问题。采用XML协议渲染HTML界面,将HITL作为工具触发,利用Redis实现数据传递。从工程设计模式角度探讨Agent演进,如Hook、图结构、责任链等,揭示其与代码设计的深层关联,展现Agent未来更多可能性。
AI赋能百度优选商家经营提效的交互设计实践
百度优选商家后台通过AI技术升级,优化了商品创建、经营管理和客服接待等核心场景。采用嵌入式、伴随式和托管式三种交互范式,分别解决表单填写、主动诊断和自动化服务问题。视觉语言统一,降低商家认知成本,提升操作效率。上线后,发品时长缩短8分钟,发品成功率提升0.7%,商家满意度显著提高,AI赋能商家降本提效。
如何做 AI Agent 喜欢的基础软件
AI Agent正迅速成为Infra软件的主要用户,这一转变要求软件设计需贴合AI心智模型,采用稳定且可扩展的接口。AI时代,软件接口需自然语言友好,同时固化符号逻辑,确保执行无歧义。Infra应支持低成本虚拟化,满足AI快速试错需求,并优化单位时间算力分配。商业模式上,AI将放大用户群体,推动服务规模化。
动态上下文发现
编码代理正迅速改变软件开发方式,其提升得益于更优的代理模型和上下文工程。动态上下文发现通过仅引入必要数据,显著提高了代理效率和响应质量。Cursor应用此技术,将冗长工具响应转为文件,利用聊天历史优化摘要,支持Agent Skills标准,高效加载MCP工具,并将终端会话视为文件处理,减少上下文膨胀,提升代理表现。
Agent全面爆发!万字长文详解上下文工程
Agent 时代,上下文成为核心变量。从 Chatbot 到 Agent,模型需在多轮任务中理解上下文,支撑持续决策。上下文工程取代提示工程,管理信息筛选、状态表达和动态调整,确保模型稳定输出。工具调用、思考过程、交互反馈等模块协同,提升 Agent 自主性与可控性。MCP 结构化落地,增强上下文可读性与可维护性。
AI Coding后端开发实战:解锁AI辅助编程新范式
AI Coding时代,开发者需建立个人上下文管理体系,破解AI上下文限制,提升辅助开发效率。准确理解需求与代码仓库,判断AI输出质量,确保代码实现正确性。通过文档驱动开发、版本控制和会话管理,实现人机协同高效开发模式,成为具备超级单兵能力的研发人员。
阿里云Tair KVCache仿真分析:高精度的计算和缓存模拟设计与实现
KVCache在大模型推理中逐渐升级为系统级基础设施,面临高维配置空间的优化挑战。阿里云推出Tair-KVCache-HiSim,首个分布式多级KVCache管理仿真工具,通过全链路建模实现高精度性能预测,支持计算选型、存储规划与调度策略协同优化,显著降低推理性能评估成本,助力智能化推理系统设计与部署。
数据合成篇|多轮ToolUse数据合成打造更可靠的AI导购助手
大语言模型正从被动响应向主动智能体进化,但高质量工具调用数据稀缺。支付宝租赁导购助理"小不懂"采用多智能体动态对话框架,通过"导演-演员"机制生成拟真业务数据,解决复杂场景下的工具协同问题。实验证明,该方法显著提升模型多轮对话理解和工具调用能力,为专业级AI助理提供高质量数据支撑。
拥抱大模型:深入剖析ReAct的核心原理、技术架构及其对AI领域的深远影响
ReAct范式通过“推理-行动-观察”闭环,将语言模型与外部工具深度结合,解决了传统AI的“事实幻觉”和“策略僵化”问题。其核心在于显式推理、环境锚定和模块解耦,使AI具备可解释性和动态任务处理能力。ReAct架构包含逻辑层、循环层和交互层,支持复杂任务的高效执行,适用于多场景适配,显著提升了AI系统的实用性和灵活性。
AI工程vs传统工程 —「道法术」中的变与不变
AI工程并非颠覆传统软件工程,而是在其基础上针对大模型不确定性进行架构升级。核心变化在于从追求绝对正确转向管理概率预期,延续分层解耦等原则,但建模重心转向上下文工程与不确定性边界控制。融合传统工程基本功与AI新工具,最终以确定性架构驾驭不确定性智能,实现可靠价值交付。
让性能瓶颈自己开口说话:AI 驱动的下一代 JVM 性能诊断革命
京东技术团队推出无侵入式智能分析方案,通过JFR低开销采集+大模型智能诊断,实现从数据到优化的全自动闭环。该方案能精准定位热点方法,如缓存瓶颈、RPC调用等,并提供分级优化建议。自然语言交互让性能分析从专家专属变为人人可用,实测可降低15-25% CPU消耗,效率提升显著。未来将扩展至多语言生态,推动研发效能革新。
基于LangChain构建下一代AI应用
AI应用正从被动顾问向智能执行者转型。新一代AI不再仅提供建议,而是能理解指令、规划任务、调用工具并完成闭环操作,直接落地业务结果。通过LLM-native架构,AI深度集成内部系统,串联复杂流程,实现自动化运维、智能客服等场景。混合架构结合AI Workflow的确定性和AI Agent的灵活性,提升系统可靠性与效率。MCP协议助力AI无缝对接各类工具,推动AI应用生态繁荣。未来,AI将成为解决复杂问题的超级助手。
Agent Engineering: A New Discipline
AI代理工程是将非确定性的LLM系统迭代优化为可靠生产体验的过程,涵盖产品思维、工程和数据科学三大技能。通过“构建、测试、发布、观察、优化、重复”的循环,团队不断从生产环境中学习并改进代理行为。AI代理的输入范围广泛,行为不可预测,传统调试方法不再适用,实时追踪和快速迭代成为关键。AI代理工程正成为应对复杂工作流的新标准,帮助团队在不确定性中实现业务价值。