AI工程:AI Agent
AI Agent 是通过工程化的手段,为大语言模型提供了获取外部工具、知识的能力。他是介于人类、大语言模型之间的代理。当用户向 AI Agent 输入问题时,AI Agent 可以使用大语言模型作为推理引擎,将一个复杂的任务进行分解、给出任务执行规划。之后 Agent 会调用外部工具获取结果,并将大语言的上次推理和工具调用结果返回给大语言模型,让大语言模型继续思考、规划。如此循环,直到将一个复杂的任务完成。
详解多智能体架构:以 Open Deep Research 项目为例
AI系统的架构演进从单体到多智能体,体现了对复杂性管理的深化。单体架构简洁但受限,流水线架构提升组织性,多智能体架构则通过并行处理和上下文隔离解决复杂任务。上下文工程在多智能体系统中至关重要,确保任务分解、并行执行和结果整合的高效性。多智能体并非初始选择,而是在单体架构遇到瓶颈时的自然演进,旨在解决大规模任务和上下文管理的挑战。
新闻分析Agent:提示工程实战
当前新闻信息繁杂,AI通过提示工程训练的Agent能有效辨别新闻真实性。以余杭事件为例,Agent通过思维链分析,判断新闻背后的动机和真实性。提示工程包括角色设定、核心指令、全局背景知识库、分析模型和输出格式,最终生成具备宏观背景和思维链分析能力的新闻分析Agent,效果显著。
What makes Claude Code so damn good (and how to recreate that magic in your agent)!?
Claude Code以其简洁高效的设计脱颖而出,通过单一主循环和小模型调用,降低了复杂性并提升了调试效率。其系统提示详尽,包含大量启发式示例和重要提醒,确保模型行为精准可控。Claude Code拒绝复杂的RAG搜索,采用LLM搜索代码库,减少了潜在故障点。工具设计兼顾低中高三个层次,灵活应对不同任务。通过显式待办清单,模型能够持续跟踪任务进展,避免上下文丢失。整体设计强调简单实用,展现了LLM代理的强大潜力。
从 0 到 1 搭建 LLM 智能简历筛选 Agent 系统
基于LLM的智能简历匹配系统通过自然语言交互、智能信息提取、量化匹配算法和多层次筛选,提升招聘效率。系统结合向量检索与结构化信息匹配,实现硬性条件过滤和多维度评分,输出候选人评估结果。未来可拓展为全流程AI智能体,优化招聘决策与人机协同。
Lightning-Fast Data Analysis: Building a Data Analyst AI agent using OpenAI Function Calling
今天,我们将打造一个基于OpenAI函数调用的数据分析AI助手,能够快速处理自然语言查询并提供即时分析结果。通过GPT模型、函数库、数据层和通信接口的协同工作,AI能理解复杂业务问题并调用相应函数进行分析。您只需用日常语言提问,如“上季度某部门畅销品有哪些?”或“展示营销支出与销售额的相关性”,AI便能生成精确答案和直观图表。这一技术简化了数据分析流程,让决策更高效。
Introducing GentWriter: Building a Multi-Agent Content Generator with Google’s ADK
在内容创作的快节奏时代,GentWriter通过生成式AI和Google的Agent Development Kit(ADK),自动生成多平台社交媒体内容。GentWriter的核心功能包括SEO描述、Twitter帖子和LinkedIn帖子,利用多代理系统实现高效内容生成。GentWriter展示了ADK在创建专用AI代理方面的潜力,为开发者提供了一个快速、模块化的解决方案,简化了内容创作流程。
How to build a deep research agent for lead generation using Google's ADK
文章介绍了一种智能化的潜在客户生成系统架构,使用Agent Development Kit (ADK)构建。该系统通过根代理InteractiveLeadGenerator协调多个子代理,分解任务为模式发现和潜在客户生成两大流程。模式发现阶段通过并行执行的公司研究团队分析历史数据,识别成功模式;潜在客户生成阶段则利用这些模式寻找未来机会。系统通过状态管理和回调机制确保高效运作,提供了源代码和工具供开发者参考。
从需求到研发全自动:如何基于Multi-Agent架构打造AI前端工程师
蚂蚁消金前端团队开发的“天工万象”是一款基于Multi-Agent架构的智能体平台,底层采用Langgraph实现,支持自我反思和自主规划工具使用。平台集成了网页开发专家、同业小qiu和全能小助手等智能体,分别处理中后台页面生成、同业数据分析和通用任务。通过ReAct范式,智能体能够动态决策和按需调用工具,解决了复杂任务中的突发噪声问题。平台还重构了上下文管理系统,支持跨机房记忆共享,提升了AI在业务场景中的应用效能。
聊聊 Agent 的架构设计思想
大模型虽强,但仍存在知识更新滞后、无法执行任务等问题。通过函数调用和结构化输出,可以增强其能力。单个Agent通过工具函数已能处理多种任务,但上下文过长可能影响性能。MultiAgent通过Supervisor调度多个Agent,解决了上下文过长问题,但架构复杂,效率未必更高。未来,随着LLM的进化,MultiAgent可能只是过渡方案。
手把手带你用 OxyGent 实现智能体的构建、部署与进化
OxyGent框架支持开发者灵活组合智能体系统,具备极致可扩展性和全链路决策追溯能力。通过20行代码即可快速启动智能体,覆盖环境安装、模型注册、MCP工具集成、智能体调试、多智能体协作及分布式部署等全流程。框架支持多种工具调用方式,提供数据持久化、并发控制及多环境配置部署功能,助力高效实现智能体应用。
腾讯的这款AI数据智能体工具Lumos,颠覆了传统的数据分析
Tomoro是一款结合大数据、表格与AI的数据分析工具,旨在通过熟悉的表格操作与AI驱动的数据分析工作台,实现零门槛的大数据自助分析。Lumos作为Tomoro中的数据智能体,采用多智能体架构,解决复杂场景下的专业问题,并通过技术优化提升用户体验。本文深入探讨了Lumos的技术思路与实践,探索AI分析的更多可能。
Expanding ADK AI agent capabilities with tools
AI代理的核心公式是LLM+记忆+规划+工具使用,工具是其关键。ADK为Java开发者提供内置工具如Google搜索、Python代码执行和文件存储服务,支持定制工具和长时任务处理。通过工具调用,AI代理能执行复杂任务,如生成代码、分析图像和管理流程。此外,代理本身也可作为工具,多代理系统更高效。MCP工具进一步扩展了代理的能力,使其能远程调用服务。
构建可靠AI Agent:从提示词、工作流到知识库的实战指南
在当前Agentic AI技术快速发展的背景下,构建可靠、高效的AI Agent应用关键在于提示词工程、工作流设计和知识库构建。提示词分为系统提示词和用户提示词,优化提示词可提升AI表现;工作流设计建议使用DSL描述,避免自然语言的不精确;知识库则需结合RAG技术,利用向量数据库和关系型数据库提高信息检索精度。AI项目应快速验证,不断迭代。
智能体(Agent)全景拆解:核心模块、技术实现与业务落地指南
智能体(Agent)是能感知环境、决策并行动的系统,核心模块包括感知、记忆、规划和行动。大语言模型(LLM)是其"大脑",通过数据驱动学习。记忆分短期(依赖上下文token)和长期(借助RAG等技术),行动需结合外部工具。规划模式有ReAct(逐步推理执行)和Plan-and-Solve(先拆解再执行)。Agent适用于需动态决策的场景,而固定流程选Workflow。评估和成本分析对优化至关重要。
Agent Has No Secret
本文探讨了Agent与RAG系统的设计理念,强调工程实践中的反馈循环、因果性和可观察性。通过共享事件总线、严格的ReACT流程和树形级联视图,系统能够清晰自解释、稳定运行并支持透明审查。代码示例展示了实时事件流和因果关系,倡导先实现基础功能,再优化高级特性,确保系统可靠且易于实现。
Deep Research的架构演进:从Multi Agent到Supervisor-Researcher的技术实践
Open Deep Research
是一个基于LangGraph的开源深度研究Agent,采用监督者-研究员模式,核心框架包括LangGraph、LangChain和asyncio。项目通过多层状态管理和有向状态图实现复杂研究流程,支持多模型和并发研究。状态管理采用override_reducer
机制,确保状态一致性和灵活性。监督者负责策略规划和任务分发,研究员执行具体任务,显著提升研究效率。项目还实现了内容去重、Token管理和错误处理机制,确保研究质量和性能优化。