AI工程:AI Agent
AI Agent 是通过工程化的手段,为大语言模型提供了获取外部工具、知识的能力。他是介于人类、大语言模型之间的代理。当用户向 AI Agent 输入问题时,AI Agent 可以使用大语言模型作为推理引擎,将一个复杂的任务进行分解、给出任务执行规划。之后 Agent 会调用外部工具获取结果,并将大语言的上次推理和工具调用结果返回给大语言模型,让大语言模型继续思考、规划。如此循环,直到将一个复杂的任务完成。
我搭了一个智能体,帮想转岗AI产品经理的小伙伴更好的准备面试
AI产品经理面试难在跨业务与技术,押题无方向、回答缺逻辑。为此打造的智能体能拆解JD核心考核点,生成匹配的高频面试题及解题框架。它结合知识库与联网检索,提供结构化回答示例,授人以渔。工作流设计清晰:JD拆解→考核点押题→题目解析,循环调用确保覆盖全面。体验优化上注重等待动画与Markdown渲染,让准备面试更高效。智能体逻辑可复用于写作等场景,展现元器平台的灵活应用潜力。
AgentScope AutoContextMemory:告别Agent上下文焦虑
智能Agent在长对话中面临成本飙升、性能下降等问题。AutoContextMemory通过自动压缩、卸载和摘要对话历史,显著降低成本、提升响应速度,并确保关键信息不丢失。其多存储架构和6种渐进式压缩策略,实现了成本与信息保留的最佳平衡,让开发者更专注于业务需求。
How AI Coding Agents Hid a Timebomb in Our App
AI助手删除了关键注释,导致代码递归逻辑失控,React 19的<Activity>组件掩盖了内存泄漏。调试时发现浏览器崩溃源于页脚编辑器无限渲染,最终定位到缺失的readOnly属性。教训:重要约束必须用测试而非注释保障,AI时代代码安全需自动化验证。
从工单、文档到结构化知识库:一套可复用的 Agent 知识采集方案
本文介绍了一套全链路自动化知识库建设方案,通过“自动提取→智能泛化→增量更新→向量化同步”的流程,解决了知识收集、质量提升和维护更新的难题。方案利用AI模拟人类工作流程,将多源知识智能提取并泛化为多样化提问方式,提升RAG召回效果,并通过Python工具和工作流实现自动化操作,大幅降低知识库建设门槛与维护成本。
AI 驱动数据范式变革:字节跳动数据库的智能进化之路
AI技术推动数据消费变革,催生“A3H”全链路适配体系。字节跳动重构数据库架构,瞄准四大趋势:融入AI生态、多产品协同、原生向量支持及智能数据管理。推出ContextSearch实现多模态检索,Mem0优化记忆存储,云搜索与Milvus提升向量处理效率,Supabase简化开发流程,DBCopilot用自然语言操作数据库。以易用、高效、低成本为核心,打造AI时代智能数据底座。
大数据数据资产智能答疑实践
大数据中台建设中,数仓作为数据资产中心,承担数据清洗与分发任务。货拉拉数仓日益庞大,用户自助查询需求凸显。智能答疑工具采用Fine-tuning与Embeddings技术,结合HyDE与GraphRAG,提升问题匹配精度与响应速度。通过RAG架构,优化问题分类与答疑流程,推动数仓智能化,降低成本,提高效率。未来方向包括数据血缘打通、AISQL应用及更多RAG架构拓展。
从CLI原理出发,如何做好AI Coding
AI编程工具CLI的魅力在于极简设计,遵循Unix哲学:轻量、可组合、可集成。它不仅是代码助手,还能管理知识库、自动化生活。技术原理上采用Single Agent架构,通过极致上下文工程提升效率。用好CLI需掌握Prompt技巧,理解AI局限,探索多智能体协作。未来开发者需学会"驾驭"AI,将其作为生产力工具而非替代品。
Hybrid Model Support:阿里云 Tair 联合 SGLang对 Mamba-Transformer 等混合架构模型的支持方案
阿里云Tair KVCache团队与SGLang社区合作,针对大模型推理中的显存与计算瓶颈,提出了混合架构模型支持方案。通过双内存池设计、状态快照技术及推测解码适配,解决了Transformer与Mamba模型的内存管理冲突,显著提升了推理效率。实测Qwen3-Next等混合模型在SGLang上表现出色,为大规模推理提供了高效、可靠的技术支持。
Agent全面爆发!一文搞懂背后的核心范式ReAct!
ReAct范式通过"推理-行动-观察"闭环,让大模型像人类一样拆解复杂任务。它要求模型先思考再行动,用外部工具获取实时数据,避免"一本正经胡说八道"。这种架构既能处理航班查询等实际问题,又让决策过程透明可追溯。相比传统方法,ReAct在事实核查、智能规划等场景表现更优,是迈向实用AI的关键一步。
告别关键词高亮,语义高亮才是解决搜索 / Agent噪音的标准答案
语义高亮在RAG和AI Agent场景中至关重要,但传统基于关键词的高亮无法满足语义需求。现有方案如OpenSearch、Provence等存在窗口小、泛化差、多语言支持不足等问题。我们自研了双语语义高亮模型,基于BGE-M3 Reranker v2,支持中英文,上下文窗口大,泛化能力强,已在HuggingFace开源预览版,未来将集成到Milvus中,提升检索效率。
面向复杂场景的高阶检索增强生成技术探索
高阶RAG技术突破传统局限,适应复杂业务场景。Adaptive RAG通过动态策略提升效率,Agentic RAG引入智能体实现自主决策,OG-RAG利用本体论增强推理能力,OAG则将推理转化为实际行动,形成闭环。这些技术共同推动知识服务向精准、高效、自动化方向演进,为企业级应用提供强大支撑。
AI热点选品:当推荐系统遇上“热点”,我们需要一场变革
热点AI选品项目构建了一套小时级追踪全网热点的自动化系统,通过精准匹配站内素材,提升信息流的新鲜感与惊喜度。系统模拟人类专家“追热点”流程,包括热点感知、理解、决策和执行,采用多路召回和级联式判别模型确保高效性与准确性。人审环节复核AI筛选结果,驱动系统持续进化。目标是从“自动化”迈向“自主化”,构建具备全局决策能力的AI Agent。
探索场景横滑卡生成中的Query聚合技术
高德地图通过大模型技术,将静态地图升级为“动态认知+主动决策”的活地图。创新推荐技术利用LLM Agent生成多维Query,提升POI推荐效率与个性化。通过Query语义聚类与精炼,结合个性化推荐理由,显著提升点击率。技术方案降低生成成本,丰富长尾POI曝光,推动内容生态健康发展。
面向业务落地的AI产品评测体系设计与平台实现
淘宝闪购技术部深度应用AI技术,构建大模型评测体系应对产品落地挑战。从业务目标、产品效果等五大维度动态评估,采用端到端与分层评测结合策略,解决环境稳定性和裁判模型适配问题。平台支持多协议接入与插件化扩展,已服务10+部门,累计执行任务超1.2万次。未来将拓展多模态评测能力,打造可视化标注工作台,推动评测生态共建。
Multi-Agent全面爆发!一文详解多智能体核心架构及LangGraph框架
LangGraph作为LangChain生态的扩展,通过有向图模型重构智能体工作流,支持多智能体协同处理复杂任务。其核心包括状态管理、条件分支、循环等控制流,实现状态持久化、断点续跑等功能,广泛应用于智能客服、自动化运维等领域。LangGraph还提供了Java版本,便于Java开发者快速集成AI大模型,构建复杂的多智能体应用。
让AI真正懂数据:猫超Matra项目中的AI知识库建设之路
猫超数据团队推出AI数据助手Matra,通过构建结构化知识库和知识图谱,实现自然语言智能取数。该方案解决了数据资产分散、语义模糊等痛点,支持业务同学低门槛获取数据,提升开发效率。目前已在资产查询、智能问数等场景落地,准确率超75%。未来将持续优化召回精度和知识保鲜机制,打造更智能的数据基础设施。