话题AI工程 › AI Agent

AI工程:AI Agent

关联话题: 智能体、Multi-Agent、Agent、多Agent、多智能体、ai agents

AI Agent 是通过工程化的手段,为大语言模型提供了获取外部工具、知识的能力。他是介于人类、大语言模型之间的代理。当用户向 AI Agent 输入问题时,AI Agent 可以使用大语言模型作为推理引擎,将一个复杂的任务进行分解、给出任务执行规划。之后 Agent 会调用外部工具获取结果,并将大语言的上次推理和工具调用结果返回给大语言模型,让大语言模型继续思考、规划。如此循环,直到将一个复杂的任务完成。

SPEC 为什么会失败?

AI辅助编码中,SPEC驱动开发是关键,但实践中常遇五大误区:背景缺失、评审缺位、过度设计、规约与实现解耦、流程形式化。应对策略包括建立项目指导原则、严格审查AI生成的SPEC、拆分SPEC追求确定性、管理变更保护规约、在高压下坚守SPEC流程。SPEC是保证AI编码质量的“规矩”,需在实践中不断摸索和迭代。

如何清洗你的Agent上下文

智能体在处理复杂任务时,工具调用结果会累积在上下文中,增加token开销和推理压力。通过上下文摘要、工作流记忆和工具输出缓存,可有效优化智能体的记忆管理。上下文摘要聚焦关键信息,工作流记忆记录任务经验,工具输出缓存则减少冗余数据。这些技术提升了智能体性能,降低了资源消耗,使其更高效地完成任务。

GELab-Zero 技术解析:当豆包联手中兴,开源界如何守住端侧 AI 的“最后防线”?

2025年12月,AI端侧领域迎来两大突破:字节跳动豆包团队发布豆包手机助手,实现本地记忆与跨应用操作;阶跃星辰开源GELab-Zero-4B模型,推动4B参数模型在安卓设备上轻量化部署。GELab-Zero采用GUI视觉方案,通用兼容且隐私安全,解决了移动端Agent落地的核心挑战,展现了强大的多模态推理能力与工程化设计。

Human In the Loop竟然可以是个MCP?

本文探讨了如何在阿里大模型研发平台OpenLM上实现“Human In The Loop”(人机回路)场景的工程方案。通过MCP协议,设计了人类与大模型的交互机制,支持人类在Agent执行过程中进行确认、答疑或授权操作。文章详细介绍了MCP工具的实现、多端协同、超时配置等技术细节,并提出了YOLO模式下的决策策略,确保Agent在人类未响应时自主完成任务。

让AI智能体拥有像人类的持久记忆:基于LangGraph的长短期记忆管理实践指南

AI智能体的记忆机制是提升其智能表现的关键。LangGraph框架通过短期记忆(Checkpointer)和长期记忆(Store)实现上下文感知与知识持久化,支持数据库存储和语义检索。实战案例展示了如何结合MCP协议构建多智能体系统,集成中断机制与记忆管理,让AI在复杂任务中保持连贯性。记忆的修剪、删除与总结策略优化了交互效率,而Supervisor架构则协调多智能体协作,推动AI向更人性化方向发展。

构建知识闭环:用CodeBuddy打造自我进化的数据分析体系

QQ浏览器推荐架构团队通过CodeBuddy AI构建知识闭环体系,解决数据分析痛点。该体系包括知识沉淀、传递、生成、信赖和闭环五个环节,利用Git管理代码和口径定义,规范协作流程,通过AI自动生成SQL代码,大幅提升效率。AI生成的代码经过多层验证后重新沉淀,形成知识复利效应,推动团队能力持续增长,工作方式从重复劳动转变为知识积累。

构建本体驱动的下一代智能数字生态系统

在数字化转型中,企业面临“语义鸿沟”挑战,当前的自动化仅解决语法互通,缺乏对业务意图的理解。为解决这一问题,构建以本体为核心的业务语义框架(BSF)是关键。BSF通过定义业务概念、关系和规则,为AI Agent提供认知与行动基础,实现从流程自动化到决策自主化的跨越。通过用例分析,BSF在智能伙伴发现、解决方案组合及故障处理中展现了显著价值,为生态系统智能化升级提供了核心支撑。

AI Coding与单元测试的协同进化:从验证到驱动

AI生成代码质量难把控?三大策略来破解!单测快速验证逻辑正确性,安全网保护存量代码演进,TDD模式精准传递需求。告别「看起来没问题」的错觉,构建AI时代的代码质量保障体系。从分页查询Bug到优惠券规则引擎,实战案例教你如何让AI编程更可靠高效。单元测试不再是负担,而是人机协作的质量引擎!

🧭 浏览器自动化革命:从 Selenium 到 AI Browser 的 20 年进化史

浏览器自动化历经20年,从Selenium的初露锋芒到Puppeteer的深度操控,再到Playwright的跨浏览器一致性革命,最终迈向AI Browser Use的智能代理时代。每一步都在解决前代的痛点,推动技术革新。AI的加入使得自动化不再依赖繁琐脚本,而是通过自然语言指令实现复杂操作,标志着自动化从“脚本驱动”迈向“智能代理”的新纪元。

基于AI的质量风险管控

百度移动生态团队构建了一套智能化质量风险管控系统(RMCS),通过AI技术实现风险前置拦截、实时感知与快速止损。系统包含三大核心模块:风险管理系统(RMS)动态识别质量漏洞,风险感知系统(ROS)智能降噪报警,风险控制系统(RCS)自动化定位止损。实践显示,线上问题总量三年降低53%,AI值班人协助率达96%,形成人机协同的高效质量防御体系。

Streamlining Security Investigations with Agents

Slack安全工程团队利用AI代理优化安全事件调查流程。通过将复杂调查分解为多个模型调用,每个调用有明确的任务和结构化输出,提升控制精度。设计包括导演、专家和评论家三类代理,分别负责推进调查、生成发现和评估质量。系统采用知识金字塔策略,低成本模型处理基础数据,高成本模型整合关键发现。实时仪表板支持监控和调试,确保高效协作。AI代理在调查中展现自发发现能力,显著提升安全防御效率。

AI 编程演进综述 v202510

AI编程正从代码补全向规范驱动开发演进,大模型能力提升是关键。开发者逐步转向定义问题和验证解决方案,核心技能变为编写精确规范。知识工程成为AI编程从玩具到工具的关键,构建AI可读写知识体系至关重要。工具形态分化融合,IDE与CLI界限模糊,未来将形成统一开发体验。

基于AI大模型的故障诊断与根因分析落地实现

AIOps智能诊断系统通过多智能体协作,模拟专家团队实现故障自动化根因分析。系统整合监控指标、日志和调用链数据,利用ReAct模式动态拆解问题,结合知识库与实时查询精准定位故障。优化后的工作流将人工数小时的排查压缩至分钟级,显著提升运维效率。目前根因定位成功率已达70%,未来将持续迭代模型与工程架构。

复杂任务AI处理实践:淘宝工程师的实战手记

AI协作者时代来临!将重复性工作拆解为"感知-决策-执行"闭环,用工具助手、复杂workflow和智能体三种模式实现自动化。给AI装上"眼睛"读取数据、"双手"操作系统、"大脑"自主决策,轻松搞定工单排查、数据治理等套路化工作。核心秘诀:提示词要像代码般精准,结果需带推理过程可追溯。记住——AI不是替代人类,而是帮我们扔掉琐碎,专注创造!

2025必看系列:AI如何重新定义研究?万字长文讲透Deep Research

AI研究新范式Deep Research崛起!从RAG到深度研究,AI正从被动检索升级为主动探索。四大核心模块——规划、问题演化、网页探索、报告生成——让AI像专家般拆解复杂任务。主流系统虽强,但数据单一性仍是痛点。腾讯Dola创新融合公私域数据,让分析更精准。这波AI进化浪潮,正在重塑研究方式!

云舟观测智能体系统技术架构解析

云舟观测智能体系统(GC Agent System)通过模块化架构和双模式执行策略,实现智能运维诊断。系统分为用户层、编排层、工具层等五层,支持路由专家模式和AI自由探索模式,灵活应对不同场景。创新点包括流式响应、智能工具调用及三层鉴权体系,确保高效安全。基于Redis的会话管理和Traceloop全链路追踪,提升系统可观测性,为企业打造自动化运维新范式。

首页 - Wiki
Copyright © 2011-2026 iteam. Current version is 2.152.0. UTC+08:00, 2026-02-08 11:48
浙ICP备14020137号-1 $访客地图$