知鸦日报2026-04-14

2026-04-13 16:30:00 ~ 2026-04-14 16:30:00

기술

从全量启动到最小核: 手淘外链唤端链路的三次架构演进

摘要

外链启动耗时过长导致用户流失?淘宝团队通过三代架构升级,从全量串行到按需裁剪,推出标准链路、极简链路和最小核链路方案。极简链路跳过首页加载,最小核链路采用"包含法"极致裁剪任务,并实现启动与资源加载并行化,将低端设备唤端耗时从10秒压缩至3秒内。同时建立发布校验、灰度验证及应急换链体系,显著提升外投承接效率与稳定性。

登录后可查看文章图片

用“信息增益-冲突惩罚”把数据选择做成可控的大模型微调加速器

摘要

大模型指令微调中,数据并非越多越好。研究发现,仅用10%-20%高质量数据就能达到甚至超越全量训练效果。SPICE方法创新性地引入梯度冲突惩罚,在挑选高信息量样本时避免方向冲突,让数据子集更高效。实验显示,10%精选数据即可匹配全量表现,训练成本大幅降低。这为模型微调提供了低成本高收益的新思路。

slack技术:Managing context in long-run agentic applications

摘要

在复杂的多代理系统中,保持代理间的协作和一致性是关键挑战。本文探讨了如何通过设计三种互补的上下文通道(Director的Journal、Critic的Review和Timeline)来管理长期运行的调查。Journal记录决策与观察,Review评估专家发现的可靠性,Timeline构建可信的事件序列,共同确保调查的连贯性和准确性。

登录后可查看文章图片

pinterest技术:Scaling Recommendation Systems with Request-Level Deduplication

摘要

Pinterest通过请求级去重技术大幅提升推荐系统效率。用户数据在推荐流程中常被重复处理,该技术确保数据仅处理一次,节省存储、训练和服务的成本。存储上采用Apache Iceberg实现10-50倍压缩;训练中通过同步批归一化和用户级掩码解决数据分布问题,提速4倍;服务端利用DCAT架构提升7倍吞吐量。这一技术全面优化了模型性能,支撑了百倍规模扩展。

salesforce技术:Reducing Agentforce AI Debugging from Two Weeks to Same-Day with Query-Driven Observability

摘要

爱因斯坦笔记本平台通过Spark工作流,将AI调试时间从两周缩短至一天,支持超4亿条记录和800GB数据的实时查询。团队开发了统一工作流,实现生产数据的直接访问,解决了传统日志和指标的局限性。通过多租户隔离和高性能架构,确保安全的查询驱动调试,提升AI代理行为透明度和调试效率。

登录后可查看文章图片

浏览器自动化:从GUI到OpenCLI

摘要

放弃前端UI自动化,解析底层API请求提升浏览器自动化效率。OpenCLI通过抓取网页背后的API,复现请求,避免点击按钮的不稳定性。支持多级认证策略,适配器生成与CLI集成,简化操作流程。未来软件竞争将转向API的可调用性,便于Agent理解与接入工作流。

登录后可查看文章图片

立正请站好:一个组件复用 Skill 的工程化实践

摘要

开发组件复用Skill,旨在解决功能开发中组件重复创建问题。通过AGENTS.md、Hook和Skill三层结构,确保AI在编码前优先复用现有组件。核心设计包括统一入口、多因素加权匹配和可复用流水线索引构建,提升AI执行稳定性。实践表明,AI在清晰流程中表现更佳,减少即兴发挥,增强工程纪律。

用RAG的思路做agent知识管理,为什么跑不通

摘要

RAG系统在Agent知识管理中面临相似度高不等于正确的问题,跨页面答案和chunk拼合时表现不佳。VKFS通过在向量数据库上构建知识交互层,采用文件系统逻辑让Agent更自然地探索知识。VKFS支持目录浏览、文件读取和精准搜索,优化了知识获取流程,提升了Agent的灵活性和效率。

登录后可查看文章图片


‹ 2026-04-13 日报 2026-04-15 日报 ›

qrcode

关注公众号
接收推送