AI工程:AI Agent
AI Agent 是通过工程化的手段,为大语言模型提供了获取外部工具、知识的能力。他是介于人类、大语言模型之间的代理。当用户向 AI Agent 输入问题时,AI Agent 可以使用大语言模型作为推理引擎,将一个复杂的任务进行分解、给出任务执行规划。之后 Agent 会调用外部工具获取结果,并将大语言的上次推理和工具调用结果返回给大语言模型,让大语言模型继续思考、规划。如此循环,直到将一个复杂的任务完成。
Context Engineering for AI Agents: Lessons from Building Manus
AI智能体系统的上下文工程是关键,通过KV缓存提升效率,避免动态增减工具,利用文件系统作为持久化内存,通过recitation机制引导注意力,保留错误信息以优化模型行为,避免少样本提示导致的模式固化,确保代理系统的稳定性和扩展性。
Unlocking Financial Insights with Finch: Uber’s Conversational AI Data Agent
Finch是优步开发的AI助手,集成于Slack,通过自然语言查询实时获取财务数据。它结合生成式AI、RAG和自查询代理,简化数据检索流程,提升效率。Finch具备上下文理解、自动SQL生成、权限控制等功能,支持数据导出至Google Sheets。其架构模块化,依赖OpenSearch索引和LangChain Langgraph,确保高精度和实时反馈。Finch优化了财务团队的数据访问体验,助力快速决策。
AI智能体全面爆发:一文吃透多Agent技术发展与进化
AI Agent的发展基于第一性原理,从基础认知到复杂协作逐步进化。图像识别借鉴人类视觉分层机制,推动深度学习突破。Agent协作经历手艺人、工作室、流水线等阶段,最终形成现代企业级智能协作网络。未来Agent将更自主、多模态、少指令,通过数据共享实现自我进化,在医疗等高价值领域潜力巨大。技术爆发往往非线性,各阶段协作形态都有其存在价值。
AI Agent 在电商内容场景的应用及演进
AI技术正推动电商内容从单一文本生成向多模态内容优化跨越。1.0时代实现文本工业化生产,2.0时代拓展至图片、视频生成,3.0时代则通过Agent技术优化内容质量,提升转化效率。未来将聚焦实时感知、智能优化、数据驱动和多模态拓展,助力商家降本增效,满足用户个性化需求。
How to Build an Agent
构建智能助手的关键在于明确任务、设计流程、开发MVP、连接数据、测试迭代和部署优化。首先定义具体任务,如邮件分类;接着设计操作流程,确保任务可行;然后构建最小可行产品,专注于核心推理任务;再连接真实数据,编写调度逻辑;测试并迭代,确保准确性;最后部署并持续优化。通过小步快跑,不断迭代,打造出实用可靠的智能助手。
AI Agents 提升 On-call 支持效率:探索与实践
基于大模型的智能运维对话系统通过意图识别、路由设计、Agent规划与执行等关键技术,解决了企业运维中的重复性高、响应成本高等问题。系统结合RAG、工作流、多Agent协作等技术,提升了复杂问题的处理效率。未来,系统将面临评估机制和多Agent协同等挑战,需进一步优化智能化与自动化能力。
基于OpenAPI和AI coding的上云智能体构建实践
基于OpenAPI和AI coding技术,我们实践了上云智能体的构建方案。通过加工阿里云openAPI数据,利用LLM生成代码并自主决策执行,减少幻觉,提升任务正确率。该方案在多轮迭代中逐步满足用户需求,有效解决API选择和参数推理问题,为上云场景提供智能化解决方案。
彻底爆了!一文吃透AIGC、Agent、MCP的概念和关系
AIGC、Agent和MCP是AI领域的热门技术。AIGC利用大模型生成多模态内容,如文本、图像等;Agent通过Function Call模型实现自主决策,执行复杂任务;MCP则标准化了LLM与外部工具的集成,提升开发效率。三者相辅相成,推动AI从生成内容到执行任务的全面进化,为开发者提供更强大的工具和平台。
Agent 框架协议“三部曲”:MCP、A2A、AG-UI
AI应用领域三大协议MCP、A2A、AG-UI分别解决Agent与工具、Agent间通信及Agent与前端交互的标准化问题,推动AI系统从单Agent向多Agent进化,提升底层能力与用户体验,激发创新与跨界协作。
基于智能体的自适应测试系统 - 淘工厂实践
电商测试迎来AI革命!传统手工测试效率低、风险高,淘工厂用多智能体打造全自动测试闭环:需求分析→用例生成→执行报告一气呵成。三大突破点——智能体协同提速82%、1人驱动N个AI、缺陷发现率翻倍。知识库+对抗机制让AI像应届生般快速成长,实测单周发现21个代码风险。未来将深化知识图谱和异常自愈能力,让测试同学从执行者升级为AI指挥官。
LangGraph Rollout: Evolving VeRL's Multi-Turn Capabilities for Agent RL
VeRL通过多轮对话和掩码重构,解决了Agent RL研究中的瓶颈,实现了LangGraph的快速集成。初始方案虽高效,但存在工具定义冗余和一致性挑战。通过自动工具封装,简化了工作流程,解决了生产与训练环境的差距。最终采用LangGraph集成,实现了训练与部署环境的完美对齐,支持复杂代理系统的演进。
How Exa built a Web Research Multi-Agent System with LangGraph and LangSmith
Exa推出了一款深度研究代理,能够自主探索网络,快速提供结构化信息。该系统利用LangGraph构建多代理架构,包含规划器、任务和观察者,动态调整任务数量以应对查询复杂性。通过搜索片段和完整结果的灵活切换,优化了令牌使用并保持研究质量。结构化JSON输出确保API使用的可靠性,LangSmith的观察性功能则帮助监控令牌消耗,支持规模化的成本效益优化。Exa的案例展示了生产级多代理系统的实现路径。
悟空Agent实战:LLaMA-Factory高危0day漏洞挖掘与修复
悟空AI Agent在LLaMA-Factory项目中挖出高危0day漏洞(CVE-2025-53002),通过多智能体协作精准定位不安全的反序列化操作。官方迅速响应修复,在torch.load()中强制启用weights_only参数阻断攻击。该漏洞CVSS评分8.3,攻击者可借恶意文件实现远程代码执行。AI自动化审计展现高效漏洞挖掘能力,推动安全防御智能化升级。
Architecting AI Agent Auditing Systems in Agentforce: Overcoming Data Cloud and Kafka Integration Challenges
Madhavi Kavathekar领导的团队成功将AI审计系统与Data Cloud集成,解决了技术挑战,并通过Kafka处理了不可预测的AI流量。该系统支持500家企业客户,每月处理2000万次模型交互,确保信任、安全和合规。团队采用迭代开发,优化了数据管道架构,动态调整流量控制,提升了系统性能和可扩展性。
AI Agent赋能自智网络技术探析与实践
通信技术飞速发展,自智网络迈向L4高度自治成为关键目标。AI Agent凭借感知、决策和执行能力,在资源管理、网络运维和业务交付三大场景实现创新突破。通过智能体驱动资源治理、自动化故障处置和政企业务快速交付,显著提升运营效率与用户体验。未来,AI Agent将向通用化、多智能体协作等方向演进,加速网络自治升级。
我不给人做产品,给 Agent 做
Agent Infra 是未来 AI 发展的关键领域,随着 Agent 数量的激增,现有互联网基础设施需重构以适应 AI 需求。Agent 与人类在交互方式、学习模式、任务执行和责任界定上存在显著差异,需设计新的机制和工具。E2B 和 Browserbase 等产品为 Agent 提供了安全环境和优化浏览器,未来 AI 市场将催生更多创新解决方案,推动 Agent 自主迭代和高效协作。