AI工程:RAG
AgentScope 正式发布 Skills 支持 - 实现渐进式披露
在大语言模型驱动的Agent系统中,如何高效管理多能力是一个核心挑战。全量加载、多Agent架构和RAG方案各有局限,本质在于缺乏灵活的上下文加载机制。Skill机制通过渐进式披露,让Agent先知道“有什么能力”,需要时再调用完整知识,实现按需加载,保持逻辑连贯性,避免资源浪费和碎片化。AgentScope-Java进一步抽象Skill存储层,支持灵活部署和代码安全执行,为多领域知识密集型应用提供简单强大的解决方案。
TOS Vectors + TLS Trace:打造更高效、更智能的存储 SDK 工厂
火山引擎对象存储TOS面对多语言SDK维护的复杂性,引入AI Agent构建自动化生成流水线。通过AI理解业务语义,优化代码生成,提升维护效率。采用TOS Vector Bucket和日志服务TLS,实现低成本高效的知识存储与检索。评估与反思机制确保代码质量,动态观测助力系统优化。SDK Agent显著提升API及文档交付效率,大幅节省人力成本。
当设计师亲自下场训练AI:它开始先“看页面”,再写文案
这篇文章揭秘了如何用AI解决出海业务中的英文文案痛点。通过"图片理解+结构化解析"的创新设计,让AI能精准把握界面上下文;结合业务知识库的硬规则约束,确保文案符合专业规范;再经过30多次调优打磨,最终产出自然流畅的"人味儿"文案。这套产品化方案让设计师无需依赖专业文案,就能高效产出符合海外用户习惯的优质内容。
基于知识工程&JoyAgent双RAG的智能代码评审系统的探索与实践
双十一大促期间,代码评审面临时间紧、任务重的挑战。传统模式效率低,AI工具误报率高。京东物流团队探索双RAG架构,结合知识工程与JoyAgent知识库,提升评审效率与质量。通过识别项目类型、代码分块处理、RAG增强与重排序机制,系统能精准发现复杂代码缺陷,确保系统稳定性。未来将扩展至多模态代码理解与全域业务知识库构建。
自建一个 Agent 很难吗?一语道破,万语难明
我花一周时间为内部研发平台接入Agent开发能力,选用了Iframe嵌入方案,结合LangGraph和Next.js+React框架,优化了系统提示词和知识库建设,通过工具接入和上下文管理提升用户体验。压缩工具响应和上下文,确保Agent高效运行,解决复杂脚本处理中的注意力稀疏问题,实现连续对话和会话中断恢复。
Engineering VP Josh Clemm on how we use knowledge graphs, MCP, and DSPy in Dash
Dropbox Dash通过连接第三方应用构建统一搜索平台,利用知识图谱和多模态理解优化内容检索。采用索引检索而非联邦检索,提升效率和个性化结果。通过LLM作为裁判评估检索质量,结合DSPy优化提示词,提高准确性。知识图谱和索引架构的复杂性带来显著提升,但需投入大量基础设施和数据处理工作。
微信文本嵌入模型KaLM-Embedding登顶全球榜单:数据工程与训练技巧详解
微信团队开源KaLM-Embedding系列模型,包括中英双语的轻量版V2系列和登顶MTEB多语言榜首的Gemma3-12B-2511。该模型通过双向注意力机制、焦点式重加权等创新技术,显著提升语义检索精准度,支持RAG架构及搜索推荐等场景。开源工具链涵盖数据配方、训练管线及商业授权,实测在客服FAQ等工业场景表现优异,低参数量下性能媲美大模型。技术报告和模型已公开。
AI 实践:Code Insight 代码搜索定位的实践分享
代码索引技术助力高效代码搜索与导航,支撑IDE跳转、AI编码等场景。主流方案包括向量嵌入的RAG和基于AST的结构化索引,前者擅长语义理解,后者专注代码结构分析。RAG通过分块、嵌入、检索三步实现精准定位,AST结合符号表构建调用关系图谱。两者互补,提升代码问答、问题定位、测试用例生成等场景效率,推动AI编码工具从能用走向好用。
AI工程vs传统工程 —「道法术」中的变与不变
AI工程并非颠覆传统软件工程,而是在其基础上针对大模型不确定性进行架构升级。核心变化在于从追求绝对正确转向管理概率预期,延续分层解耦等原则,但建模重心转向上下文工程与不确定性边界控制。融合传统工程基本功与AI新工具,最终以确定性架构驾驭不确定性智能,实现可靠价值交付。
大模型在需求分析与设计中的提效实践
AI技术正深度融入产品开发全流程,从需求文档撰写到代码生成,构建起智能开发生态。通过多Agent协作,AI能自动完成模块拆分、数据结构定义和接口设计,生成适配多语言、多框架的代码骨架,大幅提升效率和质量。RAG机制和模型微调进一步增强业务理解能力,确保文档准确性和规范性,推动研发流程智能化闭环。
RAG革命:顶级AI编程助手如何无需微调就构建生产系统
大模型时代,RAG架构成为AI应用落地的核心选择。Claude、Cursor、Copilot等顶尖产品均采用RAG而非微调,通过分层检索、混合搜索和语义缓存实现高效知识注入。相比微调,RAG具备更新快、成本低、可追溯等优势,尤其适合GPT-5级基础模型的应用适配。企业构建AI系统时,应优先考虑RAG方案,快速搭建原型并持续优化,释放大模型的真正潜力。
Milvus 向量数据库实战:从零构建高性能 RAG 系统
本文将带你从零构建基于Milvus的RAG系统,涵盖数据准备、向量检索、结果重排与位置优化等核心环节。Milvus作为高性能向量数据库,支持大规模向量存储与检索,适合AI应用。通过优化索引选择、批量处理与缓存策略,显著提升系统性能。位置优化突破U型陷阱,重排模型提高检索准确性,生产环境中还需完善错误处理与日志记录。
我搭了一个智能体,帮想转岗AI产品经理的小伙伴更好的准备面试
AI产品经理面试难在跨业务与技术,押题无方向、回答缺逻辑。为此打造的智能体能拆解JD核心考核点,生成匹配的高频面试题及解题框架。它结合知识库与联网检索,提供结构化回答示例,授人以渔。工作流设计清晰:JD拆解→考核点押题→题目解析,循环调用确保覆盖全面。体验优化上注重等待动画与Markdown渲染,让准备面试更高效。智能体逻辑可复用于写作等场景,展现元器平台的灵活应用潜力。
从工单、文档到结构化知识库:一套可复用的 Agent 知识采集方案
本文介绍了一套全链路自动化知识库建设方案,通过“自动提取→智能泛化→增量更新→向量化同步”的流程,解决了知识收集、质量提升和维护更新的难题。方案利用AI模拟人类工作流程,将多源知识智能提取并泛化为多样化提问方式,提升RAG召回效果,并通过Python工具和工作流实现自动化操作,大幅降低知识库建设门槛与维护成本。
从人力推车到智能引擎:QA 智绘项目的测试用例自动生成术
AI驱动的「QA智绘」项目通过智能引擎构建测试用例生成系统,解决传统测试中的“杀虫剂悖论”和用例维护难题。系统采用三层架构,结合AI能力实现需求解析、用例生成与优化,并通过人机协同审核确保质量。接口测试模块则通过代码+调用链双驱动,实现全覆盖与自优化,显著提升测试效率与精准度。
大数据数据资产智能答疑实践
大数据中台建设中,数仓作为数据资产中心,承担数据清洗与分发任务。货拉拉数仓日益庞大,用户自助查询需求凸显。智能答疑工具采用Fine-tuning与Embeddings技术,结合HyDE与GraphRAG,提升问题匹配精度与响应速度。通过RAG架构,优化问题分类与答疑流程,推动数仓智能化,降低成本,提高效率。未来方向包括数据血缘打通、AISQL应用及更多RAG架构拓展。