公司:Shopify
Shopify Inc.是加拿大的一家跨国电子商务公司,总部位于安大略省渥太华,Shopify也是该公司所有的电子商务平台的名称。Shopify为在线零售商提供一整套服务“包括支付、市场营销、运输和客户契合工具,以简化小型商户开设在线商店的过程”。
根据公司披露的文件,截止2019年6月,Shopify平台在大约175个国家或地区有超过一百万笔业务,2020日历年的商品总成交额1196亿美元,较2019年增长96%。
Autoresearch isn’t just for training models
作者因CI构建反复失败而苦恼,发现Autoresearch能通过循环迭代持续优化指标。他将其扩展用于缩短构建时间,从19.1秒降至65%更快。CEO Tobi加入协作,32次提交后项目开源,获3600+星,内部涌现多种提速案例。
We replaced Redis with MySQL for inventory reservations—and it scaled
Shopify将库存预留系统从Redis迁移至MySQL,利用SKIP LOCKED和每单位一行设计应对高并发。实际瓶颈并非数据库,而是连接池被其他进程耗尽。通过清理冗余操作和调整配置,最终实现稳定支撑黑五峰值流量。
Quick: An internal hosting platform for the AI era
Quick是Shopify内部平台,仅需上传HTML文件夹即可生成仅供员工访问的安全URL,并提供数据库、AI、WebSocket等零配置API。自2025年7月上线以来,已有超5万个站点,过半员工参与创建,从工具到游戏无所不包,营造了一个创意自由的内网生态。
Teaching Sidekick to say no: automated data curation with LLM judge consensus
训练数据存在盲区:生产日志只记录成功案例,模型无法学会拒绝不可能请求。我们利用小型人工标注数据集校准多个大模型作为裁判,通过严格共识机制自动标注冲突数据,形成数据飞轮。拒绝能力使评分提升28.9%,准确率86.3%,假阳性4.6%。
Clustering billions of products for agentic commerce with Catalog API
Shopify Catalog通过产品聚类解决多店铺数据异构问题,核心思路是“核心价值主张”:区分产品变体与独立产品。采用两阶段LLM管道,先提取品牌+型号,再检测异常。通过动态结构化输出确保可靠性,以精度优先原则处理数十亿商品,为AI购物代理提供统一数据层。
Flow generation through natural language: An agentic modeling approach
Shopify通过专有数据和快速迭代,优化AI助手Sidekick的工具调用能力。他们将Shopify Flow的JSON DSL转换为Python,提升了模型生成工作流的准确性。通过模拟生产环境和优化工具调用栈,降低了成本并提高了性能。利用生产反馈构建持续改进的飞轮机制,确保模型在真实场景中表现优异。最终,Sidekick在成本降低68%的同时,性能优于封闭模型。
Shopify Speed Optimization: Fixing The Real Bottlenecks
Shopify店铺速度优化的关键在于解决性能瓶颈:优化首屏内容,减少英雄图尺寸,使用占位图加载视频;压缩图片并简化色彩,避免不必要的第三方库;合理管理JavaScript和应用脚本,按需加载并延迟非关键脚本;优化CSS和字体,预加载关键资源,使用fetchpriority标记重要内容,避免首屏图片懒加载。持续监控性能,确保优化效果持久。
Building the Universal Commerce Protocol
Shopify推出的通用商务协议(UCP)为AI代理与商家交易提供开放标准,支持灵活的能力发现与谈判。UCP分层设计,核心交易功能与扩展能力分离,商家可自定义功能,代理仅处理支持的操作。协议无需中央审批,支持动态支付谈判与无缝交接,适应多样化的商务需求,推动电商生态持续进化。
SkyPilot at Shopify: Multi-cloud GPUs without the pain
Shopify利用SkyPilot框架实现多云GPU资源智能调度,通过YAML声明式配置自动路由任务——H200需求分发给Nebius集群,L4/CPU任务定向到GCP。定制插件集成Kueue实现配额管理与优先级调度,开发环境一键启停。系统自动处理InfiniBand配置和缓存挂载,工程师只需专注资源需求描述,底层跨云复杂性由平台消化。(139字)
The generative recommender behind Shopify's commerce engine
Shopify构建了一套基于用户行为序列的生成式推荐系统,通过时序编码捕捉购物场景的季节性变化,利用负采样技术优化商品边界区分,并采用增量召回策略增强推荐多样性。该系统将买家旅程转化为连续事件预测任务,结合高效CUDA内核实现低延迟推理,在BFCM大促期间成功提升5%高价值点击率及0.71%转化率。当前正探索语义ID技术以突破商品ID空间的算力限制。
Shopify’s journey to faster breadth-first GraphQL execution
Shopify开发了GraphQL Cardinal,一款广度优先执行引擎,解决深度优先遍历在高基数查询中的性能瓶颈。通过一次性解析所有对象的字段,Cardinal显著提升了大型列表查询的速度和内存效率,减少了CPU开销和垃圾回收压力。迁移过程中,Shopify逐步更新了字段解析器和追踪器,进一步优化性能。Cardinal的成功为GraphQL社区提供了新的执行模型思路,展示了广度优先策略在处理大规模数据时的潜力。
Building a Magic Mirror: AI retail experiences with Remix
线上购物愈发便捷,实体店的价值转向体验化。AI魔镜应运而生,通过视觉识别和互动,为顾客提供个性化信息、产品推荐等,提升购物趣味性。魔镜核心由全尺寸镜子、摄像头和计算机组成,运行HTTP协议,实现快速互动。借助Remix框架,服务器和客户端逻辑统一,简化开发流程。魔镜可自定义,适用于多种场景,如美妆试色、互动挑战等,为品牌创造独特购物体验。
Beyond classification: How AI agents are evolving Shopify's product taxonomy at scale
面对电商产品分类系统的快速扩展,传统手动维护分类法难以应对新兴产品和市场变化。为此,开发了一套基于AI的多智能体系统,通过结构分析和产品驱动分析,自动发现并优化分类标签,确保分类法的灵活性和前瞻性。该系统结合质量保障机制,提升分类一致性和效率,显著缩短了新兴类别的更新周期,为商家和顾客提供更精准的分类支持。
Building Production-Ready Agentic Systems: Lessons from Shopify Sidekick
Shopify的AI助手Sidekick通过“代理循环”架构处理商户需求,从简单工具调用发展为复杂代理平台。面对工具复杂度问题,采用“即时指令”策略提升系统维护性和性能。构建稳健的LLM评估系统,采用真实数据集和LLM作为评判者,确保评估质量。通过GRPO训练和奖励破解应对,不断优化模型表现。生产级代理系统需注重架构设计、评估方法和训练技巧,以实现可靠AI助手。
Migrating to React Native's New Architecture (2025) - Shopify
Shopify成功将Shopify Mobile和POS应用迁移至React Native新架构,保持每周发布并服务数百万商户。迁移涉及复杂代码库、数百个屏幕和原生模块,通过最小化代码更改、保持双架构兼容性及维护性能稳定,确保了开发速度和功能不中断。过程中解决了状态批处理、空白屏幕等常见问题,最终提升了应用启动时间和渲染性能。这一经验为其他团队提供了宝贵的迁移策略参考。
Evolution of Product Classification at Shopify: From Categories to Comprehensive Product Understanding
Shopify通过结合视觉语言模型和标准化产品分类体系,显著提升了产品理解能力。从基础分类到多模态融合,再到全面理解产品属性,系统不断进化。当前架构采用FP8量化和动态批处理优化推理效率,支持实时处理数百万产品预测。未来将引入DAG结构,扩展多语言支持和更细粒度属性提取,持续优化平台搜索、推荐和税收计算等功能。