知鸦日报2026-06-26

2026-06-25 16:30:00 ~ 2026-06-26 16:30:00

Sản phẩm

figma技术:Principles in motion

摘要

运动设计通过时间、节奏和声音引导观众,比静态图形更富叙事力。核心在于理解物理规律与缓动曲线,从自然与电影中汲取灵感。AI降低了入门门槛,但真正优秀的设计仍依赖对基础原则的掌控与意图的表达。

Công nghệ

Loop Engineering 到底是什么?看这一篇就够了

摘要

Loop Engineering 的核心,是把人从“手动循环”中解放出来,让AI Agent自主执行“发现问题-计划-执行-验证”的闭环。关键在于设定明确目标与验收标准,并利用外部Memory保持进度。你只需定好方向,剩下的交给循环自己转动。

登录后可查看文章图片

shopify技术:Autoresearch isn’t just for training models

摘要

作者因CI构建反复失败而苦恼,发现Autoresearch能通过循环迭代持续优化指标。他将其扩展用于缩短构建时间,从19.1秒降至65%更快。CEO Tobi加入协作,32次提交后项目开源,获3600+星,内部涌现多种提速案例。

shopify技术:We replaced Redis with MySQL for inventory reservations—and it scaled

摘要

Shopify将库存预留系统从Redis迁移至MySQL,利用SKIP LOCKED和每单位一行设计应对高并发。实际瓶颈并非数据库,而是连接池被其他进程耗尽。通过清理冗余操作和调整配置,最终实现稳定支撑黑五峰值流量。

shopify技术:Quick: An internal hosting platform for the AI era

摘要

Quick是Shopify内部平台,仅需上传HTML文件夹即可生成仅供员工访问的安全URL,并提供数据库、AI、WebSocket等零配置API。自2025年7月上线以来,已有超5万个站点,过半员工参与创建,从工具到游戏无所不包,营造了一个创意自由的内网生态。

登录后可查看文章图片

shopify技术:Teaching Sidekick to say no: automated data curation with LLM judge consensus

摘要

训练数据存在盲区:生产日志只记录成功案例,模型无法学会拒绝不可能请求。我们利用小型人工标注数据集校准多个大模型作为裁判,通过严格共识机制自动标注冲突数据,形成数据飞轮。拒绝能力使评分提升28.9%,准确率86.3%,假阳性4.6%。

登录后可查看文章图片

shopify技术:Clustering billions of products for agentic commerce with Catalog API

摘要

Shopify Catalog通过产品聚类解决多店铺数据异构问题,核心思路是“核心价值主张”:区分产品变体与独立产品。采用两阶段LLM管道,先提取品牌+型号,再检测异常。通过动态结构化输出确保可靠性,以精度优先原则处理数十亿商品,为AI购物代理提供统一数据层。

登录后可查看文章图片

netflix技术:The Data Canary: How Netflix Validates Catalog Metadata

摘要

Netflix构建了一个数据金丝雀系统,能在10分钟内检测目录元数据损坏。该系统利用生产流量和混沌工程,通过专用编排器、基线/金丝雀集群和行为指标(如每秒播放次数)实时验证数据,自动阻止错误数据影响用户。

netflix技术:Toward More Controllable AI Video Editing: An Early Research Exploration at Netflix

摘要

Netflix 推出 Vera 和 VOID 两款 AI 视频编辑模型。Vera 通过分层扩散模型精准编辑指定区域,保留原始画面。VOID 则能物理合理地移除物体及其交互影响,让场景自然如初。

netflix技术:Data Projects: Managing Data Assets at Netflix Scale

摘要

Netflix 的数据资产管理曾因细粒度权限和绑定个人身份的工作流而陷入困境。Data Projects 通过将资产归入项目容器,并使用合成、持久的项目身份运行工作流,解决了权限变更和工作流因人员流动中断的问题,实现了按项目统一管理访问和身份。

netflix技术:Predicting Risk in Content Launches: How Data-Driven Insights can Transform Launch Planning

摘要

Netflix通过预测模型优化内容发布排期。模型利用生产数据预测媒体资产交付时间,填补手动排期空白,显著提升准确率。经测试,预测日期比手动排期平均误差更小,可提前11周达到同等精度,有效降低因排期不准导致的发布延迟风险。

netflix技术:How Netflix Simplified Batch Compute with Kueue

摘要

Netflix用Kueue替代了自研批处理系统CMB,实现了零用户干预的迁移。Kueue支持公平共享、抢占和分层租户,提升了资源利用率。迁移过程先处理最大客户,仅用四周完成,目前管理数百万批处理任务。

登录后可查看文章图片

netflix技术:The Evolution of Cassandra Data Movement at Netflix

摘要

Netflix用新架构取代了Cassandra数据迁移系统Casspactor,新引擎直接从S3备份读取数据,生成Spark DataFrame,避免了中间表膨胀和元数据依赖问题。通过“验证、可见性、安全”三支柱策略,实现了零影响的平滑迁移,并支持更高效的数据模型感知连接器。

登录后可查看文章图片

netflix技术:Thinking Fast & Slow for a Personalized Notification System

摘要

Netflix将通知系统分为“慢策略”和“快策略”:前者制定每周个性化消息频率与节奏,后者在发送时机到来时选择最相关的内容。这种分层架构解耦了长期规划与实时决策,显著提升了用户体验,尤其让轻度用户受益。

netflix技术:A Human-Augmenting Agentic Workflow for Causal Inference

摘要

Netflix开发了一种人机协作的因果推断工作流,通过“执行者-评论者”循环自动完成分析并诊断偏差。在分析新娱乐类型对用户留存的影响时,该工作流成功识别了早期用户偏差,并通过修剪方法得到更可信的结果,其评估表现优于单次模型。

netflix技术:From Silos to Service Topology: Why Netflix Built a Real-Time Service Map

摘要

Netflix构建了实时服务拓扑系统,融合eBPF网络流、IPC指标和分布式追踪三层数据,形成动态依赖地图。工程师能快速可视化服务关系、评估影响范围、定位故障根因,而不再依赖过时的静态文档。系统不断实时更新,确保成员观影体验无缝可靠。

netflix技术:VMAF v1: Good Is Not Good Enough

摘要

Netflix开源了VMAF v1视频质量评估模型。它通过新增AIM、CAMBI等特征,优化运动检测和色度处理,并支持不同观看距离的模型,更准确地评估压缩、缩放和条带等伪影,且计算速度更快。

登录后可查看文章图片

pinterest技术:Achieving Near-Linear Training Scalability for Pinterest’s Foundation Models

摘要

Pinterest工程团队通过量化通信、均衡分片、带宽感知优化和2D并行拓扑重构,将多节点训练扩展效率从0.2倍提升至8节点7.5倍(理想值的93.75%)。核心经验:通信瓶颈必须通过减少传输字节、重塑负载和本地化昂贵操作直接解决。

dropbox技术:How we used DSPy to turn AI evaluations into better responses in Dash chat

摘要

Dropbox 使用 DSPy 优化其聊天代理 Dash。先校准 LLM 裁判使其与人类判断对齐,再用裁判反馈自动优化代理提示。结果,不完整回答减少 26%,关键遗漏降低 13%,同时 token 用量下降 5.4%,实现了质量提升与成本节约的双赢。

登录后可查看文章图片

pinterest技术:Automated Schema Evolution in Pinterest’s Next-Generation DB Ingestion Framework

摘要

Pinterest 的 CDC 管道通过分阶段收敛模型安全处理模式演变,支持添加列等兼容变更。系统自动检测源模式变化,更新 Iceberg、Flink 和 Spark 代码,并通过 PR 工作流部署,确保数据在 SLA 内逐步一致。

meta技术:Adopting AV1 for Real-Time Communication (RTC) at Scale

摘要

Meta在实时通信中采用AV1编码,通过低复杂度编码器、ML设备评估和自适应切换,已覆盖多数移动设备。AV1在低带宽下画质显著优于H.264,同时解决了码率控制、丢包恢复和功耗挑战,提升了通话质量。

登录后可查看文章图片

zozo技术:Claude CodeがSOC業務を全自動でやってくれるってさ

摘要

zalando技术:Client-Side Load Balancing at a Million Requests Per Second

摘要

Zalando将内部高扇出流量从共享边缘负载均衡器Skipper迁移到进程内客户端负载均衡。通过xxHash64一致性哈希环、基于占用率的负载均衡和N环缓启动,消除了延迟尖峰,将Skipper集群从50+ Pod缩减至8个,并节省了25%的计算成本。

登录后可查看文章图片

grab技术:Palana (Part 2): Architecting isolation, identity, and auditability for AI agents

摘要

Palana是Grab为AI代理构建的Kubernetes原生安全执行平台。它以隔离为信任单元,通过代理生命周期管理、身份与凭据分离、网络策略分层控制,实现可归因、可审计、可撤销的自主操作,让安全成为默认项。

登录后可查看文章图片

meta技术:Privacy-Aware Infrastructure in the AI-Native Era: An Asset Classification Case Study

摘要

隐私分类的核心矛盾在于:分类需在模糊中推理,而执行要求可解释、可复现。我们采用混合模式:先构建丰富上下文,用LLM处理模糊和冷启动,再将稳定模式蒸馏为确定性规则。85%流量由毫秒级规则处理,仅15%走LLM,同时保持独立评估和人工审核。

登录后可查看文章图片

zozo技术:「秘伝のタレ」を未来のシステムへ繋ぐ ── フィーチャー分割で実現した商品詳細APIリプレイス

摘要

构建 AI 时代的知识底座:直播数据 LLM Wiki 实践

摘要

知识库的构建不应依赖人工维护,而需像编译器一样,将散落的源材料(DDL、代码、文档)编译为结构化、可验证的知识资产。通过分离生成与判断、显式存储关系、支持增量更新,让AI在有限上下文中高效检索,从而真正释放领域知识的价值。

登录后可查看文章图片

Zedge-统一边缘管理平台介绍

摘要

本文围绕分布式边缘架构的五大痛点,介绍了通过自研平台、引入ARM盒子、构建自动化运维与安全体系,实现版本分钟级发布、效率提升10倍、成本降低三分之二的全栈改造。最终搭建了标准化、智能化、安全可控的新一代边缘基础架构。

登录后可查看文章图片

ReaGeo:从地理编码到空间相关性——大模型如何理解地图地址及地图搜索

摘要

地理编码的终极目标,是让非技术人员也能通过自然语言自如访问地理空间信息。ReaGeo通过将地理编码从"分词→检索→排序"的多阶段流水线重构为端到端的文本生成任务,不仅大幅降低对人工知识库的依赖,更提供了一条低成本、高鲁棒、可解释的工业部署路径。

登录后可查看文章图片

上下文越多,Agent 越笨?开源框架 Flow2Spec 给出另一种答案

摘要

Flow2Spec是一个让项目在开发过程中自然长出知识图谱的Agent工程框架。它通过路由、依赖、校验和反哺机制,将知识从静态文档变成可演进的结构,让AI每次只读取所需知识,并参与维护项目上下文,解决长期项目中AI理解与知识沉淀的难题。

登录后可查看文章图片

Khoa học

人被关久了会抑郁,一生被圈养的猪会抑郁吗

摘要

别小看猪的智商,它们能学会摇杆操作、缉毒,甚至利用镜子找食物。但聪明让它们在拥挤圈养和限位栏中更易抑郁,出现空嚼、攻击等刻板行为。猪本该在家庭中自由探索,现代养殖却剥夺了这一切。原来,猪的烦恼比打工人的社畜生活还沉重。

登录后可查看文章图片


‹ 2026-06-25 日报 2026-06-27 日报 ›

qrcode

关注公众号
接收推送