AI工程:AI Agent
AI Agent 是通过工程化的手段,为大语言模型提供了获取外部工具、知识的能力。他是介于人类、大语言模型之间的代理。当用户向 AI Agent 输入问题时,AI Agent 可以使用大语言模型作为推理引擎,将一个复杂的任务进行分解、给出任务执行规划。之后 Agent 会调用外部工具获取结果,并将大语言的上次推理和工具调用结果返回给大语言模型,让大语言模型继续思考、规划。如此循环,直到将一个复杂的任务完成。
公司项目水太深,AI Agent它把握不住!
AI Agent虽火,但实际应用中仍面临挑战。公司项目上下文碎片化、稳定性要求高、架构设计需前瞻性,AI难以完全胜任。合理使用AI可辅助业务逻辑梳理、影响面分析和生成Mock数据。提升AI编码表现可通过制定编码规范、项目特定约定和场景化Prompt模板。AI是开发辅助工具,核心业务理解与设计仍需人力完成。
一款AB实验分析智能体是如何诞生的
在算法实验中,仅关注核心指标的提升是不够的,还需识别潜在风险,评估隐性影响。实验分析Agent通过“汇总数据—分项分析—总结呈现”的框架,实现智能化分析闭环。产品设计注重助手化体验,统一表单简化用户操作,基于DAG的工作流编排提升分析质量。大模型选型结合京东自有模型,优化提示词工程,确保生成质量。未来将探索知识蒸馏和灵活数据工程框架,提升产品交互体验。
彻底爆了!一文了解LLM应用架构:从Prompt到Multi-Agent
Agent是LLM应用演进的第三阶段,能自主规划决策、调用工具完成任务。从Prompt到Chain再到Agent,LLM应用逐步实现智能化升级。Agent通过"规划器+执行器"架构,让模型自行思考行动;Multi-Agent则通过分工协作提升稳定性。虽然当前仍面临智能不足的挑战,但Agent模式已展现出"AI+"的潜力,为LLM落地应用开辟了新路径。
Training AI Agents to Write and Self-correct SQL with Reinforcement Learning
本文展示了如何构建和训练一个自校正的SQL代理,利用Agent Lightning和LangGraph实现强化学习训练。通过状态机设计,代理能够循环检查和重写SQL查询,直至准确或达到最大尝试次数。训练采用分布式客户端-服务器架构,提升模型性能。实验表明,更长上下文和更多尝试次数能提高准确性,但需权衡效率。
Grab 构建基于大模型和 Agent 的自动数据分析平台实践
Grab作为东南亚超级应用,面临复杂风控挑战,传统模式难以应对。通过大模型与智能体技术,构建了智能风控分析平台,实现“知识注入+流程重构”。平台利用RAG技术和树状SOP设计,提升风险分析的精准度和效率,支持多源异构数据处理,分析师与AI协同工作,大幅提升风控能力,为未来风控业务提供了智能化解决方案。
如何让Agent更符合预期?基于上下文工程和多智能体构建云小二Aivis的十大实战经验
阿里云“云小二Aivis”项目通过LLM和Multi-Agent架构,提升数字员工的思考与问题解决能力。实践中,团队总结了优化Agent效果的十大经验,包括清晰化预期、精准投喂上下文、结构化表达逻辑、自定义工具协议等。这些方法帮助Agent在多轮对话中保持稳定性和准确性,提升智能客服的效率和用户体验。
让Agent系统更聪明之前,先让它能被信任
大模型的智能虽强大,但其不确定性需以工程确定性为基础。Agent系统的复杂性体现在可运行、可复现与可进化三个层面,框架虽降低了开发门槛,但核心问题并未解决。真正的挑战在于让Agent长期稳定运行,而非仅能跑通Demo。智能的不确定性需要通过系统化手段驯服,确保Agent在生产环境中可靠可控。
如何构建企业级数据智能体:Data Agent 开发实践
Data Agent是一款企业级数据分析智能体,融合传统BI与高级分析技术,通过自然语言交互实现从查询到深度洞察的全流程自动化。它基于LLM构建,具备语义理解、多轮对话和代码推理能力,有效抑制幻觉并支持复杂任务规划。Data Agent还集成企业级能力,如数据资产管理、安全合规和生态集成,降低分析门槛的同时提升业务价值,助力企业实现智能化决策闭环。
GUI Agent 综述:从传统自动化到多模态大模型驱动的智能体
GUI Agent正从传统自动化向多模态大模型驱动的智能体演进,具备“看懂”并“理解”界面的能力。其核心架构包括操作环境、提示工程、记忆机制等,应用于企业办公、软件测试和虚拟助手等领域。尽管面临隐私安全和泛化能力的挑战,未来发展方向包括多模态感知融合、跨平台泛化和多智能体协作,有望推动人机交互的智能化与自动化。
Agent架构新方向?Claude Skills工作原理解析
Claude Skills是Anthropic推出的可扩展机制,允许开发者将业务流程、模板和知识打包成模块,供Claude在需要时自动调用。它采用渐进式加载策略,有效避免上下文窗口超载,且所有技能运行在安全的沙盒环境中。与Function Calling不同,Skills更注重内部流程的封装和复用,适合文档自动化、数据分析等场景,提升AI的灵活性和效率。
Beyond classification: How AI agents are evolving Shopify's product taxonomy at scale
面对电商产品分类系统的快速扩展,传统手动维护分类法难以应对新兴产品和市场变化。为此,开发了一套基于AI的多智能体系统,通过结构分析和产品驱动分析,自动发现并优化分类标签,确保分类法的灵活性和前瞻性。该系统结合质量保障机制,提升分类一致性和效率,显著缩短了新兴类别的更新周期,为商家和顾客提供更精准的分类支持。
Agent Skills 逆向工程解密,用Strands Agents SDK完美实现Agent Skills
Anthropic推出的Claude Code Skills创新性地通过文件系统动态加载技能,采用渐进式信息披露设计,提升Agent响应效率与知识深度。与传统硬编码工具调用相比,Skills支持模块化组合与跨项目复用,技术架构包含动态工具生成与Hook拦截器,实现技能即时加载与优化。Strands Agents SDK成功复刻此能力,展现高扩展性与灵活性,推动Agentic AI应用发展。
AI Agent的未来之争:任务规划,该由人主导还是AI自主?——阿里云RDS AI助手的最佳实践
AI Agent的核心架构包括LLM、任务规划、记忆和工具使用。任务规划是关键,直接影响回答效果。企业更关注AI的稳定性和可靠性,而非单纯智能。通过人工规划,AI能按预设步骤执行,确保结果准确可解释。混合规划模式结合自主与人工规划,适应不同场景需求,提升AI Agent的实用性和效率。
天猫行业中后台前端研发Agent设计
本文探讨了AI智能体在天猫中后台前端研发中的应用,提出通过Multi-Agent系统实现从需求到代码的自动化流程。文章分析了AI辅助编码的瓶颈,建议将AI介入点前移至需求阶段,采用ReAct模式和“人在环路”机制确保准确性。系统结合本地化MCP服务和GraphRAG知识图谱,提升了安全性和上下文理解能力,最终目标是解放开发者,推动研发模式从“工具辅助”向“需求驱动”转变。
一文讲懂Agent及其主流框架:自己想、自己干、自己复盘的才是好Agent!
Agent框架在复杂场景中表现卓越,尤其适合动态决策和多系统协作。与Workflow相比,Agent更能应对长尾问题和对话澄清需求。AutoGPT、LangGraph、Dify、CrewAI和AutoGen是主流框架,各有特点:AutoGPT自主性强,LangGraph支持人工干预,Dify低代码易用,CrewAI多代理协作,AutoGen灵活对话控制。选择框架需根据具体场景和需求,Agent的未来在于智能化理解和目标导向。
AI应用实战:6个agent搞定复杂指令和工具膨胀
AI造数通过单agent和多agent模式解决用户与工具间的语义断层。单agent模式简约高效,聚焦LLM对接;多agent模式拆分功能模块,提升复杂指令的准确性和响应速度。核心挑战在于prompt工程、工具治理和query规范,通过意图识别、工具过滤和推理执行优化流程,实现高效造数。