知鸦日报2025-08-08

2025-08-07 16:30:00 ~ 2025-08-08 16:30:00

技术

uber技术:From Restaurants to Retail: Scaling Uber Eats for Everything

摘要

Uber Eats 推出了新一代库存与目录系统 INCA,旨在处理大规模、多样化的零售数据。INCA 支持无限扩展、灵活属性添加、智能行为规则和数据丰富化,确保高效处理数十亿条每日变更。系统通过多阶段数据流处理,从数据摄取、存储到发布与索引,确保数据在消费者面前的高质量呈现。INCA 还具备强大的版本控制与回滚功能,保障数据安全与可靠性。

登录后可查看文章图片

airbnb技术:Seamless Istio Upgrades at Scale

摘要

Airbnb自2019年起大规模使用Istio,支持Kubernetes和虚拟机环境,处理数千万QPS。升级Istio时,采用金丝雀模型,同时运行新旧版本,确保零停机。通过rollouts.yml文件控制版本分发,逐步迁移工作负载。Krispr框架在CI和Pod准入时自动注入Istio版本标签,虚拟机则通过mxagentmxrc控制器管理升级。整个升级过程强调安全性和逐步推进,确保高可用性。

登录后可查看文章图片

哔哩哔哩技术:ICML25 视频问答中以语言为中心的结构化推理

摘要

多模态大语言模型在视频问答中面临推理不透明和难以控制的挑战。哔哩哔哩Index团队与上海交通大学提出了一种以语言为中心的树状推理(LTR)框架,通过递归分解复杂问题为简单子问题,并自下而上推理,显著提升了模型的准确性和可解释性。实验表明,LTR在11个基准数据集上表现优异,为视频理解开辟了新路径。

登录后可查看文章图片

面向大规模代码仓库的结构化知识抽取与分层检索

摘要

CodeRAG技术通过AST解析构建代码知识图谱,支持多语言分析和精准上下文构建,显著提升代码检索与生成质量。其混合索引机制和智能上下文选择算法,优化了检索效率与准确性。未来发展方向包括语义理解深化、开发平台集成及智能知识共享生态构建,助力软件开发智能化与生产力提升。

登录后可查看文章图片

360技术:云舟观测:基于Nginx日志实现WEB应用请求监控

摘要

Nginx作为高性能Web服务器,其日志监控对服务稳定性和用户体验至关重要。prometheus-nginxlog-exporter可将Nginx日志转化为Prometheus可识别的监控指标,支持请求数量、耗时、客户端IP等数据统计。云舟观测集成该工具并优化存储和查询性能,支持一键安装和可视化监控。通过配置日志路径和格式,用户可快速生成Nginx监控图表,并设置告警规则,实现深度监控。

登录后可查看文章图片

阿里巴巴技术:一次缓存引发的文件系统数据不一致问题排查与深度解析

摘要

小编带你揭秘一次由自研分布式文件系统客户端EFC缓存架构更新引发的严重数据不一致问题。通过详细排查,发现问题源于缓存中版本号回退,导致客户端读取旧数据并写入文件系统,造成数据损坏。最终通过维护递增的缓存版本号,成功修复问题。整个过程不仅揭示了缓存机制的潜在风险,还深入探讨了POSIX接口的底层行为,为类似问题提供了宝贵经验。

登录后可查看文章图片

滴滴技术:滴滴云原生可观测 HUATUO 开源项目正式入驻 CCF

摘要

滴滴开源的云原生操作系统可观测性项目HUATUO正式加入中国计算机学会(CCF)重点孵化项目。HUATUO基于BPF技术,解决了云原生环境中的故障诊断难题,具备低损耗、多维度内核观测能力,已在滴滴生产环境中广泛应用。项目通过统一框架支持指标采集、事件处理、任务追踪等功能,并与主流开源技术栈无缝对接,助力系统性能优化与故障分析,推动可观测领域基础设施的标准化发展。

登录后可查看文章图片

美团技术:联合营销生态下的广告机制设计与实践

摘要

美团创新推出"联合营销"模式,品牌商与零售商共同出资投放广告,实现流量资源位共享。为解决多方竞价问题,首创"集资拍卖"机制,历经规则化、模型化到整体拍卖三阶段技术迭代,开发出JAMA、JRegNet、JTransNet等算法方案。该机制有效提升广告变现效率,CPM和ROI均增长超20%,相关成果已发表于KDD等顶级会议。

登录后可查看文章图片

高德技术:让AI读懂代码需求:大模型微调训练实践及端侧运行部署

摘要

高德终端团队在代码仓库升级中,面临版本跨越大、代码更新多的挑战。为解决研发效率问题,开发了基于code RAG和code Agent的提效工具,但仍存在召回率、准确率及稳定性问题。通过大模型微调,重点学习代码模块,简化任务,提升推理准确性,最终实现78%的综合准确率,并在mac端成功部署,满足端侧运行需求。

登录后可查看文章图片

字节跳动技术:基于日志的 JuiceFS 可观测最佳实践

摘要

JuiceFS 访问日志可通过火山引擎日志服务 TLS 统一采集和解析,支持深度 SQL 分析和实时监控。TLS 提供即用分析大盘,覆盖写操作、顺序读、生命周期等核心场景,帮助用户高效进行性能分析和故障诊断。通过预设模板和自定义仪表盘,用户可快速洞察文件系统操作,优化业务负载,实现全链路可观测能力。

登录后可查看文章图片

JinaVDR: 一个图文混排文档搜索任务的基准集

摘要

JinaVDR是一个专为处理视觉复杂文档设计的评测基准,填补了现有基准在视觉信息检索领域的空白。它覆盖20种语言、95项任务,包含图表、表格、扫描件等多种文档类型,模拟真实世界的检索场景。通过视觉问答和关键词查询两种方式,JinaVDR评估模型处理多语言、多格式文档的能力,推动下一代向量模型的发展。

登录后可查看文章图片

小红书技术:小红书自研Binlog Server守护MySQL数据0丢失

摘要

小红书数据库团队推出基于Binlog Server的数据一致性解决方案,通过提升半同步复制性能,加速日志传输,实现故障时自动补数据,保证数据一致性。该方案使用极少的资源(1C1G)即可将复制速度提升至300MB/s+,优化了故障切换效率,降低运维成本和业务风险,实现数据库快速恢复。目前该方案已100%部署于小红书半同步复制集群。

登录后可查看文章图片


‹ 2025-08-07 日报 2025-08-09 日报 ›

qrcode

关注公众号
接收推送