话题 › 公司 › pinterest

公司：pinterest

Pinterest（中文译名：缤趣），是一个网络与手机的应用程序，可以让用户利用其平台作为个人创意及项目工作所需的视觉探索工具，同时也有人把它视为一个图片分享类的社交网站，用户可以按主题分类添加和管理自己的图片收藏，并与好友分享。其使用的网站布局为瀑布流（Pinterest-style layout）。

Pinterest由美国加州帕罗奥图的一个名为Cold Brew Labs的团队营运，创办人为Ben Silbermann、 Paul Sciarra 及 Evan Sharp。2010年正式上线。“Pinterest”是由“Pin”及“interest”两个字组成，在社交网站中的访问量仅次于Facebook、Youtube、VKontakte以及Twitter。

Debugging the One-in-a-Million Failure: Migrating Pinterest’s Search Infrastructure to Kubernetes

Pinterest在将搜索系统Manas迁移到Kubernetes时，发现每百万次搜索请求中，有一次会耗时100倍。经过排查，问题源于cAdvisor的container_referenced_bytes指标，该指标每30秒扫描并清除页表访问位，导致内存密集型搜索系统出现延迟。团队通过禁用该指标，成功解决了性能问题，确保Manas在Kubernetes上的稳定运行。

pinterest技术

Next Gen Data Processing at Massive Scale At Pinterest With Moka (Part 1 of 2)

Pinterest数据工程团队基于Kubernetes构建了新一代大数据处理平台Moka，以替代老化的Hadoop系统。Moka采用Spark on EKS架构，整合了Spark Operator、YuniKorn调度器和Celeborn远程混洗服务，支持ARM/Graviton实例和容器化部署。平台通过Archer作业提交系统实现与现有工作流的无缝集成，并引入自动化验证流程确保迁移稳定性。目前已完成70%批处理作业迁移，性能提升5%，同时通过资源隔离和队列管理优化了成本效益。

pinterest技术

Scaling Pinterest ML Infrastructure with Ray: From Training to End-to-End ML Pipelines

Ray框架通过三大优化显著提升大规模ML任务效率：1）优化Ray Data底层结构，取消冗余的块切片和合并操作，降低CPU/内存开销；2）特征转换采用请求ID去重和避免PyArrow冗余拷贝，减少计算与传输消耗；3）UDF层面整合过滤器并使用Numba即时编译加速数值计算。实测训练管道吞吐量提升2-3倍，首页推荐模型达理论峰值90%性能。

pinterest技术

Unlocking Efficient Ad Retrieval: Offline Approximate Nearest Neighbors in Pinterest Ads

Pinterest探讨了在线与离线近似最近邻（ANN）检索在广告推荐中的应用。在线ANN实时响应用户行为，提升广告相关性，但成本较高；离线ANN通过预计算降低基础设施成本，适用于静态查询场景。实验表明，离线ANN在相似商品广告和视觉嵌入中表现优异，成本降低50%以上，未来计划扩展至搜索和首页推荐，并开发自有离线ANN平台。

pinterest技术

Automated Migration and Scaling of Hadoop™ Clusters

Pinterest通过引入Hadoop控制中心（HCC）优化大数据集群管理，简化了集群扩展和缩减操作。HCC自动处理节点退役、数据复制和ASG调整，减少人工干预，确保数据安全。HCC架构包括管理节点和多个工作节点，支持自动化的集群操作，并与Terraform协同工作，避免配置冲突。未来，HCC计划增加更多自动化功能，如节点轮换和故障检测。

pinterest技术

Next-Level Personalization: How 16k+ Lifelong User Actions Supercharge Pinterest’s Recommendations

Pinterest推出TransActV2，通过160倍的用户行为序列扩展，结合Next Action Loss和高效部署方案，实现终身行为建模。该模型提升了推荐系统的精度和多样性，显著减少用户隐藏行为，增加保存和互动。系统优化降低了99%的延迟，实际应用中提升了用户粘性和内容发现效果。这一突破为大规模实时个性化推荐树立了新标杆。

pinterest技术

Adopting Docs-as-Code at Pinterest

Pinterest工程师团队打造了内部文档系统PDocs，采用"文档即代码"理念，用Markdown编写、Git管理，结合静态站点生成器自动构建统一文档中心。PDocs解决了传统wiki工具的质量和可发现性问题，支持代码审查、搜索集成和AI问答，上线后获广泛采用。未来将优化编辑体验并增强文档互动性，持续提升技术文档质量。

pinterest技术

Healthier Personalization with Surveys

Pinterest通过用户调查实现个性化推荐，避免纯按参与度或时间顺序排名的弊端。其“家庭动态相关性调查”帮助优化内容，确保用户看到的是真正与其兴趣相符的灵感。这种方法不仅提升了用户体验，还体现了对用户福祉的重视，展现了平台在健康个性化推荐上的创新与实践。

pinterest技术

Modernizing Home Feed Pre-Ranking Stage

Pinterest升级了首页推荐系统的预排序层，采用全新系统与模型设计。通过请求级和物品级子组件联合训练、解耦服务提升效率，并引入根叶架构优化在线推理。创新性地结合早期漏斗日志与曝光数据，解决样本选择偏差问题。模型蒸馏技术进一步对齐预排序与完整排序效果，显著提升业务指标。团队还实现了模型自动重训练，持续优化推荐时效性。

pinterest技术

How Pinterest Accelerates ML Feature Iterations via Effective Backfill

Pinterest通过优化特征回填流程提升推荐和广告模型的迭代效率。从最初的Spark全量回填到两阶段回填，再到引入Iceberg表和Ray框架，显著降低了时间和成本。两阶段回填实现并行处理，减少数据混洗；Iceberg提升分区管理和数据压缩；Ray支持训练时动态数据加载。整体效率提升90倍，数据压缩率达75%。

pinterest技术

500X Scalability of Experiment Metric Computing with Unified Dynamic Framework

Pinterest通过统一动态框架（UDF）解决了实验指标计算中的扩展性和延迟问题。UDF利用动态DAG技术，实现了并行批处理、自动回填和通知功能，显著提升了指标交付速度和可靠性。该框架支持100倍指标增长，未来可扩展至500倍，同时简化了管道创建，使开发者专注于创新。标准化处理推动了实验平台的创新和业务成果。

pinterest技术

Multi-gate-Mixture-of-Experts (MMoE) model architecture and knowledge distillation in Ads Engagement modeling development

多门混合专家模型（MMoE）通过动态分配计算资源提升效率，促进多任务学习。结合知识蒸馏，弥补数据保留期短导致的性能差距，增强新模型表现。实验验证，MMoE在广告用户匹配任务中表现优异，显著提升线上线下指标。混合精度推断和轻量门层设计有效降低基础设施成本，确保模型性能不降。

pinterest技术

公司：pinterest的相关资料

公司：pinterest

Debugging the One-in-a-Million Failure: Migrating Pinterest’s Search Infrastructure to Kubernetes

Next Gen Data Processing at Massive Scale At Pinterest With Moka (Part 1 of 2)

Scaling Pinterest ML Infrastructure with Ray: From Training to End-to-End ML Pipelines

Unlocking Efficient Ad Retrieval: Offline Approximate Nearest Neighbors in Pinterest Ads

Automated Migration and Scaling of Hadoop™ Clusters

Next-Level Personalization: How 16k+ Lifelong User Actions Supercharge Pinterest’s Recommendations

Adopting Docs-as-Code at Pinterest

Healthier Personalization with Surveys

Modernizing Home Feed Pre-Ranking Stage

How Pinterest Accelerates ML Feature Iterations via Effective Backfill

500X Scalability of Experiment Metric Computing with Unified Dynamic Framework

Multi-gate-Mixture-of-Experts (MMoE) model architecture and knowledge distillation in Ads Engagement modeling development

Migrating 3.7 Million Lines of Flow Code to TypeScript

Handling Network Throttling with AWS EC2 at Pinterest

Improving Pinterest Search Relevance Using Large Language Models

Building Holiday Finds: How Pinterest Engineers Reimagined Gift Discovery