公司:dropbox
Dropbox 于2007年5月由麻省理工学院学生德鲁·休斯顿和阿拉什·费道斯创立,时名Evenflow, Inc.,于2009年10月更名为Dropbox,总部位于美国加利福尼亚州旧金山。
Dropbox通过免费增值模式营运,提供线上存储服务,通过云计算实现互联网文件同步,用户可以存储并共享文件和文件夹。在云存储领域的竞争对手包括谷歌公司的Google Drive、微软公司的OneDrive和亚马逊公司的AWS等。
Dropbox于2018年3月23日在美国纳斯达克上市交易,股票代码是DBX,发行3600万股股票,发行价21美元。Dropbox在2017年营业收入11.1亿美元,注册用户超过5亿,净亏损1.117亿美元。
Introducing Nova, our internal platform for coding agents
Dropbox 构建了 Nova 平台,用于在云端运行编码代理,以处理重复性工程任务。它通过隔离环境、验证循环和上下文集成,将代理应用于 CI 故障修复、测试去脆化和迁移等工作,从而提升开发效率。
Improving storage efficiency in Magic Pocket, our immutable blob store
Dropbox的Magic Pocket存储系统因数据碎片化导致存储开销增加,原有压缩策略无法快速回收空间。为此,团队开发了多策略压缩方案:L1维持高填充卷的稳态,L2高效合并中度低填充卷,L3快速回收极低填充卷。通过动态调整阈值和并发控制,系统显著降低存储开销,提升了压缩效率和系统稳定性。
Reducing our monorepo size to improve developer velocity
Dropbox通过优化Git的delta压缩策略,成功将服务器monorepo从87GB缩减至20GB,克隆时间从一小时降至15分钟。问题源于i18n文件路径与Git压缩启发式的不匹配,导致跨语言文件错误配对。本地测试验证后,与GitHub合作调整repack参数,实现了高效压缩。此举提升了CI效率和开发者体验,同时为大规模monorepo维护提供了宝贵经验。
How we optimized Dash's relevance judge with DSPy
Dropbox Dash利用DSPy框架优化AI相关性评估系统,通过自动化提示调优提升模型与人类判断的一致性。实验显示,优化后模型在成本降低的同时,评分误差减少45%,JSON格式错误率下降97%。该系统支持快速适配新模型,兼顾生产环境稳定性和大规模标注需求,显著提升了搜索排序和训练数据生成的质量。
Using LLMs to amplify human labeling and improve Dash search relevance
Dropbox Dash采用检索增强生成(RAG)模式,结合企业搜索和大语言模型(LLM),为用户提供基于组织内部信息的精准答案。其搜索排序模型通过机器学习和混合标注(人工与LLM辅助)训练,优化文档相关性评分。LLM在生成大规模标注数据时,经过人工校准,确保质量与一致性。该方法不仅提升了搜索效率,还适用于多模态内容,持续优化用户体验。
How low-bit inference enables efficient AI
低比特推理技术通过减少内存和计算需求,显著提升AI模型运行效率和降低成本。量化是关键,如8位、4位量化,能加速矩阵运算并节省能源。MXFP和NVFP等新格式直接在硬件中支持量化,进一步提升性能。Dropbox Dash等产品依赖此类技术,确保快速、可靠的AI体验。然而,低比特推理的广泛应用仍需解决模型质量和硬件支持等挑战。
Engineering VP Josh Clemm on how we use knowledge graphs, MCP, and DSPy in Dash
Dropbox Dash通过连接第三方应用构建统一搜索平台,利用知识图谱和多模态理解优化内容检索。采用索引检索而非联邦检索,提升效率和个性化结果。通过LLM作为裁判评估检索质量,结合DSPy优化提示词,提高准确性。知识图谱和索引架构的复杂性带来显著提升,但需投入大量基础设施和数据处理工作。
Inside the feature store powering real-time AI in Dropbox Dash
Dropbox Dash通过AI整合文件、聊天记录和公司内容,提升搜索效率。其核心功能依赖特征存储系统,结合实时机器学习,快速定位相关文档。系统采用混合架构,结合Feast、Spark和Dynovault,确保低延迟和高并发处理。通过批处理、流处理和直接写入三种数据摄取方式,保持特征数据的新鲜度,优化搜索排名体验。
How Dash uses context engineering for smarter AI
Dash从企业搜索系统发展为智能AI助手,面临的关键挑战是如何精确管理上下文信息。通过减少工具定义、过滤无关内容及引入专用代理,Dash大幅提升了决策效率。统一检索工具和知识图谱的引入,进一步优化了信息检索的准确性和速度。上下文工程的核心在于提供最相关的信息,使模型更专注于任务本身,从而实现更智能的执行。
Half-Quadratic Quantization of large machine learning models
大模型量化技术迎来新突破!HQQ算法无需校准数据,仅用5分钟即可完成Llama-2-70B的2比特量化,速度超GPTQ 50倍。该技术通过半二次优化和稀疏损失函数处理权重异常值,在保持精度的同时大幅降低内存占用。实测显示,2比特量化的70B模型性能超越全精度13B版本,视觉模型ViT-H-14在2比特下仍优于全精度ViT-B-32。开源代码已发布,推动大模型轻量化部署。
With Mobius Labs' Aana models, we're bringing deeper multimodal understanding to Dropbox Dash
Dropbox推出AI助手Dash,整合多种内容与工具,提升工作效率。Dash具备多模态处理能力,能理解文本、图像、音频和视频,并通过AI初创公司Mobius Labs的Aana模型,高效分析复杂场景。Aana结合开源模型,优化推理性能,降低计算成本,使多媒体内容更易搜索和解读。Dash即将登陆Dropbox,助力团队快速获取所需信息,简化工作流程。
A practical blueprint for evaluating conversational AI at scale
大语言模型应用看似简单,背后却隐藏着复杂的概率链条。任何环节的微调都可能引发意外,导致模型输出失真。通过构建标准化评估流程,将测试融入每一步,确保每次更新都经过严格检验。采用公开和内部数据集,结合LLM自评机制,精准把控模型输出质量。自动化评估与实时监控相结合,有效捕捉边缘案例和潜在问题,推动系统持续优化,确保AI产品的可靠性和一致性。
Making file encryption fast and secure for teams with advanced key management
Dropbox推出新型高级密钥管理方案,采用三层加密体系,提升团队文件加密的安全性和效率。通过团队密钥、命名空间密钥和数据块密钥的分层管理,实现了快速文件共享和复制。方案结合硬件安全模块,优化密钥缓存和轮换,确保数据安全的同时不影响用户体验。此举为企业和组织提供了更强大的数据保护能力,适应不断演进的网络安全需求。
Seventh-generation server hardware at Dropbox: our most efficient and capable architecture yet
Dropbox历经14年发展,从几十台服务器扩展到数万台,构建了全球最大的定制存储系统。第七代硬件平台推出,搭载Crush、Dexter和Sonic,支持传统计算、数据库和存储任务,新增GPU层级Gumby和Godzilla,提升存储带宽和机架功率。通过紧密合作供应商,优化热管理和振动控制,Dropbox在AI产品如Dash的支持上迈出重要一步,硬件性能显著提升,为未来技术变革奠定基础。
How we brought multimedia search to Dropbox Dash
Dropbox Dash升级多媒体搜索能力,解决图片、视频等非文本文件的检索难题。面对存储计算成本高、元数据缺失等挑战,团队重构底层架构:采用轻量级元数据索引降低开销,按需生成预览平衡效率与成本,优化地理定位查询逻辑。通过智能缓存和并行处理提升响应速度,让模糊命名的媒体文件也能被快速定位。未来计划引入语义嵌入和OCR技术,进一步缩小与文本搜索的体验差距。
Building Dash: How RAG and AI agents help us meet the needs of businesses
Dropbox Dash 是一款集成了 AI 功能的通用搜索和知识管理工具,旨在解决信息碎片化问题。通过机器学习和生成式 AI,Dash 提供强大的搜索体验,支持跨应用内容查找、组织和保护。其核心采用检索增强生成(RAG)技术,结合 AI 代理,处理复杂任务。Dash 高效应对数据多样性、碎片化和多模态挑战,提升企业的协作和生产力,同时确保信息安全。