话题公司 › pinterest

公司:pinterest

Pinterest(中文译名:缤趣),是一个网络与手机的应用程序,可以让用户利用其平台作为个人创意及项目工作所需的视觉探索工具,同时也有人把它视为一个图片分享类的社交网站,用户可以按主题分类添加和管理自己的图片收藏,并与好友分享。其使用的网站布局为瀑布流(Pinterest-style layout)。

Pinterest由美国加州帕罗奥图的一个名为Cold Brew Labs的团队营运,创办人为Ben Silbermann、 Paul Sciarra 及 Evan Sharp。2010年正式上线。“Pinterest”是由“Pin”及“interest”两个字组成,在社交网站中的访问量仅次于Facebook、Youtube、VKontakte以及Twitter。

LLM-Powered Relevance Assessment for Pinterest Search

How Pinterest Built a Real‑Time Radar for Violative Content using AI

Improving Quality of Recommended Content through Pinner Surveys

Pinterest通过用户调研优化内容推荐,用5分制问卷收集了5000张图片的视觉评分,训练了一个轻量级神经网络模型来预测内容质量。模型采用成对排序学习,结合不同兴趣类别的差异,有效区分高/低质量内容。上线后,首页推荐、搜索和关联内容三大场景的用户体验和互动指标均有提升,实现了用户满意与商业增长的双赢。未来计划引入视觉语言模型进一步升级推荐系统。

Autonomous Observability at Pinterest (Part 1 of 2)

Pinterest通过引入AI代理和模型上下文协议(MCP)服务器,解决了可观测性数据孤岛问题。MCP服务器将日志、指标、追踪等数据统一整合,赋予AI代理更强的上下文处理能力,提升了问题根因分析的效率和精准度。团队还开发了Tricorder智能代理,帮助工程师快速定位问题,减少故障解决时间,迈向自主可观测性新时代。

Slashing CI Wait Times: How Pinterest Cut Android Testing Build Times by 36%+

Pinterest团队通过自建测试平台PinTestLab,采用基于运行时的分片机制,优化了Android端到端测试的CI流程。利用历史测试时长和稳定性数据,贪婪算法将测试分配到EC2托管的模拟器上,确保各分片运行时间相近。此举使端到端构建时间减少9分钟,最慢分片运行时间降低55%,显著提升了开发效率。

A Decade of AI Platform at Pinterest

Identify User Journeys at Pinterest

Pinterest通过用户旅程模型提升推荐系统,将用户兴趣、意图和上下文结合,动态生成个性化旅程。利用动态关键词提取和层次聚类技术,系统自动提取用户旅程并进行命名、扩展和排名。通过LLM优化旅程推断,提升推荐质量。实验显示,旅程感知通知显著提高了用户参与度和反馈率,未来将整合更多LLM技术,进一步优化系统。

Next Gen Data Processing at Massive Scale At Pinterest With Moka (Part 2 of 2)

Pinterest 的 Moka 平台基于 AWS EKS 构建,用于大规模数据处理。平台通过 Terraform 和 Helm 实现 EKS 集群部署,使用 Fluent Bit 进行日志管理,并结合 OTEL 和 Prometheus 实现指标监控。Moka 支持 Spark 应用,提供动态 UI 访问和历史日志查询,优化了镜像管理和资源隔离,推动了 Pinterest 基础设施现代化。

Developer Experience at Pinterest: The Journey to PinConsole

Pinterest通过构建内部开发者平台PinConsole,有效解决了工具碎片化和开发流程不一致的问题。基于开源框架Backstage,PinConsole提供了统一的开发入口,集成了GitHub、Jira等工具,简化了工程师的工作流。平台采用定制化插件架构,优化了性能与扩展性,显著提升了开发效率与用户体验。未来,PinConsole将继续扩展功能,进一步优化资源管理与可观测性,助力Pinterest在复杂技术生态中保持高效创新。

Debugging the One-in-a-Million Failure: Migrating Pinterest’s Search Infrastructure to Kubernetes

Pinterest在将搜索系统Manas迁移到Kubernetes时,发现每百万次搜索请求中,有一次会耗时100倍。经过排查,问题源于cAdvisor的container_referenced_bytes指标,该指标每30秒扫描并清除页表访问位,导致内存密集型搜索系统出现延迟。团队通过禁用该指标,成功解决了性能问题,确保Manas在Kubernetes上的稳定运行。

Next Gen Data Processing at Massive Scale At Pinterest With Moka (Part 1 of 2)

Pinterest数据工程团队基于Kubernetes构建了新一代大数据处理平台Moka,以替代老化的Hadoop系统。Moka采用Spark on EKS架构,整合了Spark Operator、YuniKorn调度器和Celeborn远程混洗服务,支持ARM/Graviton实例和容器化部署。平台通过Archer作业提交系统实现与现有工作流的无缝集成,并引入自动化验证流程确保迁移稳定性。目前已完成70%批处理作业迁移,性能提升5%,同时通过资源隔离和队列管理优化了成本效益。

Scaling Pinterest ML Infrastructure with Ray: From Training to End-to-End ML Pipelines

Ray框架通过三大优化显著提升大规模ML任务效率:1)优化Ray Data底层结构,取消冗余的块切片和合并操作,降低CPU/内存开销;2)特征转换采用请求ID去重和避免PyArrow冗余拷贝,减少计算与传输消耗;3)UDF层面整合过滤器并使用Numba即时编译加速数值计算。实测训练管道吞吐量提升2-3倍,首页推荐模型达理论峰值90%性能。

Unlocking Efficient Ad Retrieval: Offline Approximate Nearest Neighbors in Pinterest Ads

Pinterest探讨了在线与离线近似最近邻(ANN)检索在广告推荐中的应用。在线ANN实时响应用户行为,提升广告相关性,但成本较高;离线ANN通过预计算降低基础设施成本,适用于静态查询场景。实验表明,离线ANN在相似商品广告和视觉嵌入中表现优异,成本降低50%以上,未来计划扩展至搜索和首页推荐,并开发自有离线ANN平台。

Automated Migration and Scaling of Hadoop™ Clusters

Pinterest通过引入Hadoop控制中心(HCC)优化大数据集群管理,简化了集群扩展和缩减操作。HCC自动处理节点退役、数据复制和ASG调整,减少人工干预,确保数据安全。HCC架构包括管理节点和多个工作节点,支持自动化的集群操作,并与Terraform协同工作,避免配置冲突。未来,HCC计划增加更多自动化功能,如节点轮换和故障检测。

Next-Level Personalization: How 16k+ Lifelong User Actions Supercharge Pinterest’s Recommendations

Pinterest推出TransActV2,通过160倍的用户行为序列扩展,结合Next Action Loss和高效部署方案,实现终身行为建模。该模型提升了推荐系统的精度和多样性,显著减少用户隐藏行为,增加保存和互动。系统优化降低了99%的延迟,实际应用中提升了用户粘性和内容发现效果。这一突破为大规模实时个性化推荐树立了新标杆。

Adopting Docs-as-Code at Pinterest

Pinterest工程师团队打造了内部文档系统PDocs,采用"文档即代码"理念,用Markdown编写、Git管理,结合静态站点生成器自动构建统一文档中心。PDocs解决了传统wiki工具的质量和可发现性问题,支持代码审查、搜索集成和AI问答,上线后获广泛采用。未来将优化编辑体验并增强文档互动性,持续提升技术文档质量。

ホーム - Wiki
Copyright © 2011-2025 iteam. Current version is 2.148.2. UTC+08:00, 2025-12-13 05:36
浙ICP备14020137号-1 $お客様$