在线工具

在线工具

反馈

文库码库小摊

更多

话题 › 公司 › pinterest

公司：pinterest

Pinterest（中文译名：缤趣），是一个网络与手机的应用程序，可以让用户利用其平台作为个人创意及项目工作所需的视觉探索工具，同时也有人把它视为一个图片分享类的社交网站，用户可以按主题分类添加和管理自己的图片收藏，并与好友分享。其使用的网站布局为瀑布流（Pinterest-style layout）。

Pinterest由美国加州帕罗奥图的一个名为Cold Brew Labs的团队营运，创办人为Ben Silbermann、 Paul Sciarra 及 Evan Sharp。2010年正式上线。“Pinterest”是由“Pin”及“interest”两个字组成，在社交网站中的访问量仅次于Facebook、Youtube、VKontakte以及Twitter。

Slashing CI Wait Times: How Pinterest Cut Android Testing Build Times by 36%+

Pinterest团队通过自建测试平台PinTestLab，采用基于运行时的分片机制，优化了Android端到端测试的CI流程。利用历史测试时长和稳定性数据，贪婪算法将测试分配到EC2托管的模拟器上，确保各分片运行时间相近。此举使端到端构建时间减少9分钟，最慢分片运行时间降低55%，显著提升了开发效率。

pinterest技术

A Decade of AI Platform at Pinterest

pinterest技术

Identify User Journeys at Pinterest

Pinterest通过用户旅程模型提升推荐系统，将用户兴趣、意图和上下文结合，动态生成个性化旅程。利用动态关键词提取和层次聚类技术，系统自动提取用户旅程并进行命名、扩展和排名。通过LLM优化旅程推断，提升推荐质量。实验显示，旅程感知通知显著提高了用户参与度和反馈率，未来将整合更多LLM技术，进一步优化系统。

pinterest技术

Next Gen Data Processing at Massive Scale At Pinterest With Moka (Part 2 of 2)

Pinterest 的 Moka 平台基于 AWS EKS 构建，用于大规模数据处理。平台通过 Terraform 和 Helm 实现 EKS 集群部署，使用 Fluent Bit 进行日志管理，并结合 OTEL 和 Prometheus 实现指标监控。Moka 支持 Spark 应用，提供动态 UI 访问和历史日志查询，优化了镜像管理和资源隔离，推动了 Pinterest 基础设施现代化。

pinterest技术

Developer Experience at Pinterest: The Journey to PinConsole

Pinterest通过构建内部开发者平台PinConsole，有效解决了工具碎片化和开发流程不一致的问题。基于开源框架Backstage，PinConsole提供了统一的开发入口，集成了GitHub、Jira等工具，简化了工程师的工作流。平台采用定制化插件架构，优化了性能与扩展性，显著提升了开发效率与用户体验。未来，PinConsole将继续扩展功能，进一步优化资源管理与可观测性，助力Pinterest在复杂技术生态中保持高效创新。

pinterest技术

Debugging the One-in-a-Million Failure: Migrating Pinterest’s Search Infrastructure to Kubernetes

Pinterest在将搜索系统Manas迁移到Kubernetes时，发现每百万次搜索请求中，有一次会耗时100倍。经过排查，问题源于cAdvisor的container_referenced_bytes指标，该指标每30秒扫描并清除页表访问位，导致内存密集型搜索系统出现延迟。团队通过禁用该指标，成功解决了性能问题，确保Manas在Kubernetes上的稳定运行。

pinterest技术

Next Gen Data Processing at Massive Scale At Pinterest With Moka (Part 1 of 2)

Pinterest数据工程团队基于Kubernetes构建了新一代大数据处理平台Moka，以替代老化的Hadoop系统。Moka采用Spark on EKS架构，整合了Spark Operator、YuniKorn调度器和Celeborn远程混洗服务，支持ARM/Graviton实例和容器化部署。平台通过Archer作业提交系统实现与现有工作流的无缝集成，并引入自动化验证流程确保迁移稳定性。目前已完成70%批处理作业迁移，性能提升5%，同时通过资源隔离和队列管理优化了成本效益。

pinterest技术

Scaling Pinterest ML Infrastructure with Ray: From Training to End-to-End ML Pipelines

Ray框架通过三大优化显著提升大规模ML任务效率：1）优化Ray Data底层结构，取消冗余的块切片和合并操作，降低CPU/内存开销；2）特征转换采用请求ID去重和避免PyArrow冗余拷贝，减少计算与传输消耗；3）UDF层面整合过滤器并使用Numba即时编译加速数值计算。实测训练管道吞吐量提升2-3倍，首页推荐模型达理论峰值90%性能。

pinterest技术

Unlocking Efficient Ad Retrieval: Offline Approximate Nearest Neighbors in Pinterest Ads

Pinterest探讨了在线与离线近似最近邻（ANN）检索在广告推荐中的应用。在线ANN实时响应用户行为，提升广告相关性，但成本较高；离线ANN通过预计算降低基础设施成本，适用于静态查询场景。实验表明，离线ANN在相似商品广告和视觉嵌入中表现优异，成本降低50%以上，未来计划扩展至搜索和首页推荐，并开发自有离线ANN平台。

pinterest技术

Automated Migration and Scaling of Hadoop™ Clusters

Pinterest通过引入Hadoop控制中心（HCC）优化大数据集群管理，简化了集群扩展和缩减操作。HCC自动处理节点退役、数据复制和ASG调整，减少人工干预，确保数据安全。HCC架构包括管理节点和多个工作节点，支持自动化的集群操作，并与Terraform协同工作，避免配置冲突。未来，HCC计划增加更多自动化功能，如节点轮换和故障检测。

pinterest技术

Next-Level Personalization: How 16k+ Lifelong User Actions Supercharge Pinterest’s Recommendations

Pinterest推出TransActV2，通过160倍的用户行为序列扩展，结合Next Action Loss和高效部署方案，实现终身行为建模。该模型提升了推荐系统的精度和多样性，显著减少用户隐藏行为，增加保存和互动。系统优化降低了99%的延迟，实际应用中提升了用户粘性和内容发现效果。这一突破为大规模实时个性化推荐树立了新标杆。

pinterest技术

Adopting Docs-as-Code at Pinterest

Pinterest工程师团队打造了内部文档系统PDocs，采用"文档即代码"理念，用Markdown编写、Git管理，结合静态站点生成器自动构建统一文档中心。PDocs解决了传统wiki工具的质量和可发现性问题，支持代码审查、搜索集成和AI问答，上线后获广泛采用。未来将优化编辑体验并增强文档互动性，持续提升技术文档质量。

pinterest技术

Healthier Personalization with Surveys

Pinterest通过用户调查实现个性化推荐，避免纯按参与度或时间顺序排名的弊端。其“家庭动态相关性调查”帮助优化内容，确保用户看到的是真正与其兴趣相符的灵感。这种方法不仅提升了用户体验，还体现了对用户福祉的重视，展现了平台在健康个性化推荐上的创新与实践。

pinterest技术

Modernizing Home Feed Pre-Ranking Stage

Pinterest升级了首页推荐系统的预排序层，采用全新系统与模型设计。通过请求级和物品级子组件联合训练、解耦服务提升效率，并引入根叶架构优化在线推理。创新性地结合早期漏斗日志与曝光数据，解决样本选择偏差问题。模型蒸馏技术进一步对齐预排序与完整排序效果，显著提升业务指标。团队还实现了模型自动重训练，持续优化推荐时效性。

pinterest技术

How Pinterest Accelerates ML Feature Iterations via Effective Backfill

Pinterest通过优化特征回填流程提升推荐和广告模型的迭代效率。从最初的Spark全量回填到两阶段回填，再到引入Iceberg表和Ray框架，显著降低了时间和成本。两阶段回填实现并行处理，减少数据混洗；Iceberg提升分区管理和数据压缩；Ray支持训练时动态数据加载。整体效率提升90倍，数据压缩率达75%。

pinterest技术

500X Scalability of Experiment Metric Computing with Unified Dynamic Framework

Pinterest通过统一动态框架（UDF）解决了实验指标计算中的扩展性和延迟问题。UDF利用动态DAG技术，实现了并行批处理、自动回填和通知功能，显著提升了指标交付速度和可靠性。该框架支持100倍指标增长，未来可扩展至500倍，同时简化了管道创建，使开发者专注于创新。标准化处理推动了实验平台的创新和业务成果。

pinterest技术

«
1
2
3
4
5
6
7
8
9
10
»

首页 - Wiki
Copyright © 2011-2025 iteam. Current version is 2.148.1. UTC+08:00, 2025-11-28 07:36
浙ICP备14020137号-1 $访客地图$