知鸦日报2026-03-19

2026-03-18 16:30:00 ~ 2026-03-19 16:30:00

Technology

zalando技术:Search Quality Assurance with AI as a Judge

摘要

Zalando利用LLM作为评估员,自动化检测新市场搜索质量。通过NER标签聚类和LLM翻译复用现有市场搜索场景,构建多语言测试集。基于GPT-4o的视觉-文本评估框架可快速定位产品属性错误、NER识别缺失等问题,单次评估仅需250美元,5小时内完成1500个搜索场景的验证。该方案在葡萄牙、希腊等新市场落地前有效识别了词形还原、术语歧义等关键问题。

登录后可查看文章图片

dropbox技术:How we optimized Dash's relevance judge with DSPy

摘要

Dropbox Dash利用DSPy框架优化AI相关性评估系统,通过自动化提示调优提升模型与人类判断的一致性。实验显示,优化后模型在成本降低的同时,评分误差减少45%,JSON格式错误率下降97%。该系统支持快速适配新模型,兼顾生产环境稳定性和大规模标注需求,显著提升了搜索排序和训练数据生成的质量。

登录后可查看文章图片

airbnb技术:From vendors to vanguard: Airbnb’s hard-won lessons in observability ownership

摘要

Airbnb从第三方监控平台迁移至自研开源Prometheus解决方案,全面掌控指标采集、存储和查询。通过自动化工具迁移了1000个服务、3亿时间序列和31万个告警。初期选择简单服务验证可行性,后续纠正查询意图,引入元数据引擎提升准确性。迁移不仅优化了成本和控制,还重塑了开发者体验,增强了系统可靠性和响应速度。

meta技术:Ranking Engineer Agent (REA): The Autonomous AI Agent Accelerating Meta’s Ads Ranking Innovation

摘要

Meta推出自主AI代理REA,革新广告排名模型的机器学习生命周期。REA自主生成假设、启动训练任务、调试失败并迭代结果,显著提升模型准确度和工程效率。通过休眠唤醒机制,REA管理跨天乃至跨周的异步工作流,减少人工干预,实现高效持续操作。REA结合历史数据和前沿研究,生成高质量假设,并在计算预算内灵活应对现实约束。其首次生产验证中,模型准确度翻倍,工程产出提升五倍,为ML工程带来新范式。

meta技术:Friend Bubbles: Enhancing Social Discovery on Facebook Reels

摘要

Facebook Reels的“好友气泡”功能通过机器学习分析好友关系和互动内容,推荐更相关的视频,帮助用户发现朋友喜欢的视频。系统结合用户调查和平台互动数据,精准识别好友关系强度,优化视频排名,提升社交互动体验。功能设计注重性能优化,确保流畅播放和低CPU开销,同时通过持续反馈循环改进推荐效果,增强用户粘性和内容消费深度。

登录后可查看文章图片

Using LLMs to reverse JavaScript variable name minification

摘要

大语言模型(LLM)如ChatGPT和llama2为反混淆JavaScript代码提供了新思路。通过结合传统工具如Babel和LLM的语义理解能力,Humanify工具成功还原了变量名和代码格式,确保代码功能不变。该工具开源,支持开发者轻松反混淆并提高代码可读性。

vivo技术:Ada-RefSR: 自适应隐式相关建模,开启“信而有证”的参考超分新范式

摘要

ICLR 2026接收的Ada-RefSR模型,针对单步超分模型的“幻觉”问题,提出“信而有证”新范式。通过注意力机制引入参考信息,结合隐式相关性建模进行过滤与验证,有效避免误匹配导致的伪影。该方法在多个Benchmark上表现优异,尤其在FID和LPIPS指标上领先,具备高效、鲁棒的特点,适用于移动端影像处理。

登录后可查看文章图片

得物技术:大禹平台:流批一体离线Dump平台的设计与应用

摘要

大禹平台是一个离线Dump平台,专注于搜索、推荐、广告场景的异构数据处理。平台采用流批一体架构,通过可视化DAG编排工具提升开发效率,确保数据质量与稳定性。其核心优化包括MySQL镜像至HBase、Binlog订阅平台化、状态大宽表消除反查等,支持任务复用与分层管理,显著加速数据处理与Dump流程。未来将持续增强算子体系与性能优化,深化与索引平台的协同,释放更多业务价值。

登录后可查看文章图片

360技术:被 Karpathy 下场推荐的 NanoClaw 是什么来头

摘要

OpenClaw一夜爆红,成为GitHub最受欢迎开源项目,其IM远程操控电脑的AI助手形态满足了大众对Jarvis的幻想。NanoClaw则以其小巧易懂、容器隔离安全的特点,被Karpathy推荐。两者各有优势,OpenClaw功能全面但安装复杂,NanoClaw安装简便且安全,但生态尚不完善。Claws项目虽前景广阔,但技术护城河浅,未来面临激烈竞争。

登录后可查看文章图片

阿里巴巴技术:AI Coding前端实践后的复盘总结

摘要

AI Coding在前端开发中展现显著效率,尤其在样板代码生成和UI组件搭建上。然而,复杂业务逻辑和样式细节仍需人工干预。通过优化提示词、建立知识库和严格代码审查,团队提炼出“人机协同”最佳工作流,提升研发速度与质量。AI Coding工具虽便捷,但依赖高质量Prompt和知识库,未来需加强AI驱动的代码审查体系建设,确保智能化开发的可持续性。

登录后可查看文章图片

货拉拉技术:从RAG到GraphRAG:货拉拉元数据检索应用实践

摘要

RAG技术结合信息检索与文本生成,提升回答准确性与可信度。GraphRAG进阶引入知识图谱,优化检索与生成过程,增强复杂问题推理能力。方案从Naive RAG到GraphRAG,逐步解决召回率与准确率问题,显著提升问答质量与业务效率。未来将持续优化检索能力和Agentic RAG应用,推动元数据检索系统进一步发展。

登录后可查看文章图片


‹ 2026-03-18 日报 2026-03-20 日报 ›

qrcode

关注公众号
接收推送