AI工程:AI Agent
AI Agent 是通过工程化的手段,为大语言模型提供了获取外部工具、知识的能力。他是介于人类、大语言模型之间的代理。当用户向 AI Agent 输入问题时,AI Agent 可以使用大语言模型作为推理引擎,将一个复杂的任务进行分解、给出任务执行规划。之后 Agent 会调用外部工具获取结果,并将大语言的上次推理和工具调用结果返回给大语言模型,让大语言模型继续思考、规划。如此循环,直到将一个复杂的任务完成。
AI工程vs传统工程 —「道法术」中的变与不变
AI工程并非颠覆传统软件工程,而是在其基础上针对大模型不确定性进行架构升级。核心变化在于从追求绝对正确转向管理概率预期,延续分层解耦等原则,但建模重心转向上下文工程与不确定性边界控制。融合传统工程基本功与AI新工具,最终以确定性架构驾驭不确定性智能,实现可靠价值交付。
让性能瓶颈自己开口说话:AI 驱动的下一代 JVM 性能诊断革命
京东技术团队推出无侵入式智能分析方案,通过JFR低开销采集+大模型智能诊断,实现从数据到优化的全自动闭环。该方案能精准定位热点方法,如缓存瓶颈、RPC调用等,并提供分级优化建议。自然语言交互让性能分析从专家专属变为人人可用,实测可降低15-25% CPU消耗,效率提升显著。未来将扩展至多语言生态,推动研发效能革新。
基于LangChain构建下一代AI应用
AI应用正从被动顾问向智能执行者转型。新一代AI不再仅提供建议,而是能理解指令、规划任务、调用工具并完成闭环操作,直接落地业务结果。通过LLM-native架构,AI深度集成内部系统,串联复杂流程,实现自动化运维、智能客服等场景。混合架构结合AI Workflow的确定性和AI Agent的灵活性,提升系统可靠性与效率。MCP协议助力AI无缝对接各类工具,推动AI应用生态繁荣。未来,AI将成为解决复杂问题的超级助手。
Agent Engineering: A New Discipline
AI代理工程是将非确定性的LLM系统迭代优化为可靠生产体验的过程,涵盖产品思维、工程和数据科学三大技能。通过“构建、测试、发布、观察、优化、重复”的循环,团队不断从生产环境中学习并改进代理行为。AI代理的输入范围广泛,行为不可预测,传统调试方法不再适用,实时追踪和快速迭代成为关键。AI代理工程正成为应对复杂工作流的新标准,帮助团队在不确定性中实现业务价值。
AI代码生成平台的挑战与优化思考
AI驱动的代码生成平台如Lovable、v0、Bolt为非技术用户提供了快速构建Web应用的可能性,但面临准确性、效率和资源利用等系统性挑战。主流按需生成模式存在正确率衰减、重复创造和资源低效等问题。预生产+按需定制模式通过提前生成标准化应用和组件,结合AI和专业工程师优化,有望提升生成正确率和效率,推动个性化数字产品生态发展。
大模型在需求分析与设计中的提效实践
AI技术正深度融入产品开发全流程,从需求文档撰写到代码生成,构建起智能开发生态。通过多Agent协作,AI能自动完成模块拆分、数据结构定义和接口设计,生成适配多语言、多框架的代码骨架,大幅提升效率和质量。RAG机制和模型微调进一步增强业务理解能力,确保文档准确性和规范性,推动研发流程智能化闭环。
一句话点外卖:AI时代的智能语音点餐实践
淘宝闪购与天猫精灵合作推出“智能语音点餐”,用大模型实现“一句话点外卖”。用户语音指令由天猫精灵转文字,淘宝Agent理解意图并执行操作,最后语音反馈。当前方案采用固定任务流和话术模板,解决大模型耗时长和幻觉问题,但存在处理复杂需求弱、对话机械等局限。未来将探索模型自闭环,实现更自然的交互体验。
RDSAI-CLI - 用AI重塑数据库终端CLI体验
阿里云推出RDSAI-CLI,一款AI驱动的命令行工具,将传统数据库操作升级为意图式交互。它支持SQL与自然语言混合输入,智能路由和上下文感知,简化查询生成、慢查询诊断、Schema分析和性能优化。RDSAI-CLI开源发布,旨在提升数据库操作的智能性和自然性,让开发者更高效地管理数据库。
阿里云Tair KVCache Manager:企业级全局 KVCache 管理服务的架构设计与实现
阿里云即将开源企业级全局KVCache管理服务Tair KVCache Manager,专为Agentic AI设计。该服务通过高性能网络解耦算力与存储,支持PB级KVCache池化,具备动态伸缩、多租户隔离等能力,兼容主流推理引擎。架构上采用中心化元数据管理,抽象LLM语义接口,并集成多种存储后端,显著提升大模型推理性能与资源利用率。
AI coding 智能体设计
AI coding工具的设计核心在于智能体架构与提示词工程。Gemini-CLI通过命令预处理、MCP扩展和子智能体实现模块化设计,优化开发效率。其ReAct框架支持意图识别、工具调用和记忆压缩,而规约驱动开发则通过OpenSpec规范确保代码质量。Claude Code进一步引入Skills和代码执行MCP,解决传统工具广播的token爆炸问题。两大工具均支持自定义命令、插件扩展和记忆管理,为开发者提供灵活高效的AI编程体验。
我搭了一个智能体,帮想转岗AI产品经理的小伙伴更好的准备面试
AI产品经理面试难在跨业务与技术,押题无方向、回答缺逻辑。为此打造的智能体能拆解JD核心考核点,生成匹配的高频面试题及解题框架。它结合知识库与联网检索,提供结构化回答示例,授人以渔。工作流设计清晰:JD拆解→考核点押题→题目解析,循环调用确保覆盖全面。体验优化上注重等待动画与Markdown渲染,让准备面试更高效。智能体逻辑可复用于写作等场景,展现元器平台的灵活应用潜力。
AgentScope AutoContextMemory:告别Agent上下文焦虑
智能Agent在长对话中面临成本飙升、性能下降等问题。AutoContextMemory通过自动压缩、卸载和摘要对话历史,显著降低成本、提升响应速度,并确保关键信息不丢失。其多存储架构和6种渐进式压缩策略,实现了成本与信息保留的最佳平衡,让开发者更专注于业务需求。
How AI Coding Agents Hid a Timebomb in Our App
AI助手删除了关键注释,导致代码递归逻辑失控,React 19的<Activity>组件掩盖了内存泄漏。调试时发现浏览器崩溃源于页脚编辑器无限渲染,最终定位到缺失的readOnly属性。教训:重要约束必须用测试而非注释保障,AI时代代码安全需自动化验证。
从工单、文档到结构化知识库:一套可复用的 Agent 知识采集方案
本文介绍了一套全链路自动化知识库建设方案,通过“自动提取→智能泛化→增量更新→向量化同步”的流程,解决了知识收集、质量提升和维护更新的难题。方案利用AI模拟人类工作流程,将多源知识智能提取并泛化为多样化提问方式,提升RAG召回效果,并通过Python工具和工作流实现自动化操作,大幅降低知识库建设门槛与维护成本。
AI 驱动数据范式变革:字节跳动数据库的智能进化之路
AI技术推动数据消费变革,催生“A3H”全链路适配体系。字节跳动重构数据库架构,瞄准四大趋势:融入AI生态、多产品协同、原生向量支持及智能数据管理。推出ContextSearch实现多模态检索,Mem0优化记忆存储,云搜索与Milvus提升向量处理效率,Supabase简化开发流程,DBCopilot用自然语言操作数据库。以易用、高效、低成本为核心,打造AI时代智能数据底座。
大数据数据资产智能答疑实践
大数据中台建设中,数仓作为数据资产中心,承担数据清洗与分发任务。货拉拉数仓日益庞大,用户自助查询需求凸显。智能答疑工具采用Fine-tuning与Embeddings技术,结合HyDE与GraphRAG,提升问题匹配精度与响应速度。通过RAG架构,优化问题分类与答疑流程,推动数仓智能化,降低成本,提高效率。未来方向包括数据血缘打通、AISQL应用及更多RAG架构拓展。