话题公司 › DoorDash

公司:DoorDash

DoorDash, Inc. 是一家经营线上食品订购和食品配送的美国公司。它的交易代码为 DASH。DoorDash 拥有 56% 的市场份额,是美国最大的食品配送平台。在便利配送类别中,它还拥有60%的市场份额。截至2020年12月31日,平台已有45万商家、2,000万消费者、100万快递员使用。

How to investigate the online vs offline performance for DNN models

机器学习模型在离线评估与在线推理间的性能差距是行业普遍挑战。以DoorDash为例,深度学习的在线-离线AUC差距高达4.3%,通过优化特征一致性、实时特征更新及缓存残留问题,差距降至0.76%。特征新鲜度对模型表现至关重要,延迟特征更新会导致性能显著下降。短期方案通过调整特征偏移减少差距,长期则需完善特征日志系统,提升模型泛化能力。

Bridging SQL Dialects: Building a unified translator

现代数据生态系统中,多语言数据环境至关重要。DoorDash采用多种工具和框架满足多样化需求,但SQL方言差异导致翻译错误和性能问题。Transaxle SQL翻译服务通过与Databricks合作,实现了跨平台无缝互操作。其预处理、验证和后处理步骤确保翻译准确性,并通过反馈循环持续改进。未来,Transaxle将与AI助手集成,进一步提升智能数据交互能力,推动湖仓架构下的数据互操作性。

Profile Generation with LLMs: Understanding consumers, merchants, and items

DoorDash利用大语言模型(LLM)生成自然语言描述的用户、商家和商品档案,提升个性化推荐的可解释性。传统嵌入向量虽高效但难以理解,LLM生成的档案则直观易读,支持透明推荐、用户偏好编辑和快速功能原型设计。通过自动化流程,DoorDash实现了大规模档案生成,捕捉细粒度细节,为机器学习系统提供丰富输入,推动平台升级。

Advancing Menu Content with AI: How DoorDash uses AI to generate menu descriptions

DoorDash开发了一套AI系统,帮助本地餐厅生成个性化菜单描述。该系统结合了数据检索、生成和评估三大模块,确保描述准确且符合餐厅风格。通过多模态数据提取和相似菜品检索,系统解决了信息匮乏的问题。生成模块利用条件提示和上下文学习,提升描述的个性化。评估模块则通过自动化与人工审核结合,持续优化输出质量。这套系统不仅提升了菜单描述的吸引力,还助力餐厅在数字时代脱颖而出。

A scalable LLM approach to enhancing chatbot knowledge with user-generated content

DoorDash利用聚类算法和大语言模型(LLM)优化了支持聊天机器人。通过分析匿名聊天记录,系统自动识别知识库中的关键问题,并生成高质量的知识文章。LLM不仅分类问题,还快速生成初稿,减少了手动维护的工作量。这一方案显著降低了问题升级率,提升了客户满意度,同时让团队能专注于处理复杂问题。

Using LLMs to infer grocery preferences from DoorDash restaurant orders

DoorDash利用消费者餐厅订单历史,通过大型语言模型(LLM)生成个性化杂货推荐,解决冷启动问题。系统将订单转化为标签,结合LLM进行标签到分类的映射,生成相关商品推荐。该方法通过压缩用户信号、离线处理及个性化评分,确保高质量推荐,同时降低成本。LLM在稀疏数据下表现优异,结合检索增强生成(RAG)和混合技术,提升推荐准确性和一致性。

Bridging Affordability, Familiarity, and Novelty: DoorDash’s LLM-assisted personalization framework

DoorDash在KDD 2025巴黎研讨会上展示了一种结合传统机器学习与大语言模型(LLM)的个性化框架,旨在优化多垂直零售的发现体验。该框架动态平衡用户三大价值维度:熟悉度、价格亲民度和新鲜感,通过LLM增强检索、排序和展示过程,实现更精准的个性化推荐,提升用户购物体验。

Part 2: Building a configuration-driven badge serving framework at DoorDash

DoorDash推出了徽章服务框架(BSF),通过配置驱动的方式简化了徽章创建与管理流程。BSF标准化了接口,支持跨平台一致展示,提升了开发速度和产品灵活性。框架包含徽章处理器、用例组和类型等抽象模块,支持实验和动态配置,无需代码变更即可上线新徽章。BSF显著提升了徽章发布效率,增强了用户体验和系统可观测性。

Building an in-house case management platform

DoorDash通过多年努力,构建了统一的内部门户案例管理平台,解决了多工具切换、数据碎片化等问题。平台采用渐进式迁移策略,引入React前端和Kotlin后端,优化了用户体验和数据整合。自动化功能和缓存策略提高了效率,支持复杂场景如欺诈调查和电话/聊天支持。新架构提升了系统互操作性,减少了手动操作,显著改善了案例处理速度和准确性。

How DoorDash achieves fast travel estimates

DoorDash通过创新的Geo-Grid-Cache系统,优化了配送路由的效率和精度。该系统将服务区域划分为H3地理网格,预先计算并缓存配送时间,大幅降低了实时计算的延迟和成本。结合多分辨率设计,确保了短途与长途配送的准确性。借助Databricks的Spark技术,离线数据处理效率提升了10倍,为用户提供了更快速、更可靠的配送体验。

Part 1: How DoorDash leveraged its product knowledge graph to enable a high-velocity tagging and badging experience

DoorDash在2023年推出了商品标签功能,但遇到了系统分散、测试框架不统一等挑战。2024年,团队通过平台化改造,将标签数据与UI渲染解耦,并集成到产品知识图谱(PKG)中。PKG通过机器学习处理菜单和商品数据,支持标签的快速创建和应用。存储层基于CockroachDB构建,提供直观的数据建模和高效查询。未来将深入探讨如何将标签转化为UI展示的徽章。

Inside DoorDash’s Service Mesh Journey: Part 1 — Migration at Scale

DoorDash 从单体架构转向微服务架构后,面临服务间通信不统一、系统复杂性增加等问题。2021年的一次严重宕机促使团队加速构建基于 Envoy 的服务网格,以标准化通信、提升可靠性。初期通过最小化功能集快速上线,逐步引入负载均衡、熔断器等关键功能。随着服务网格的扩展,团队解决了多种兼容性和性能问题,最终支持了每秒超过8000万请求的峰值流量。

Using LLM to transcribe restaurant menu photos

DoorDash利用AI优化餐厅菜单更新,通过OCR和LLM技术从菜单照片中提取结构化数据。然而,多样化的菜单结构和高精度要求挑战了LLM的准确性。为解决这一问题,DoorDash引入了基于传统ML的“护栏”模型,结合图像特征和OCR输出,提升转录精度。该系统结合人力和AI,确保高质量转录,同时降低成本与延迟,推动AI自动化进入生产环境。未来将继续优化模型,提升菜单照片质量,进一步改进AI系统。

How DoorDash leverages LLMs to evaluate search result pages

DoorDash开发了AutoEval系统,利用大语言模型(LLM)自动化评估搜索质量,解决传统人工标注的规模、延迟和一致性难题。AutoEval结合全页相关性(WPR)指标,快速、准确地评估搜索结果,提升迭代效率,释放专家资源专注于复杂问题。通过精细的提示工程和模型微调,AutoEval在关键任务中表现优于外部标注者,显著改善了搜索体验的评估与优化。

Distributed build service for monorepos

DoorDash正在从microrepos转向monorepo,以简化依赖管理和代码重用。尽管monorepo带来了可扩展性和构建时间的挑战,但DoorDash通过自研的分布式构建服务解决了这些问题,实现了高效的并行构建。该服务使用Gradle,支持Kotlin和protobuf项目,通过动态配置和资源管理优化构建过程,显著提高了构建速度和可靠性,提升了开发者的工作效率。

How DoorDash leverages LLMs for better search retrieval

DoorDash采用大语言模型优化搜索系统,通过知识图谱和混合检索策略提升查询理解。系统灵活处理复杂查询,精准链接用户意图与商品属性,确保搜索结果相关性。结合检索增强生成技术,有效减少模型幻觉,提高检索精度。在线测试显示,新系统显著提升用户体验和转化率,为动态市场环境下的复杂查询处理提供了新思路。

trang chủ - Wiki
Copyright © 2011-2025 iteam. Current version is 2.147.0. UTC+08:00, 2025-10-29 00:13
浙ICP备14020137号-1 $bản đồ khách truy cập$