知鸦日报2024-03-11

2024-03-10 16:30:00 ~ 2024-03-11 16:30:00

产品

产品与业务如何有效对齐需求及目标

摘要

业务BRD、用户分析和产品BRD三者之间的关系。相信本文让你秒懂。

登录后可查看文章图片

技术

古茗技术:老项目的外链太多?我是这么处理的

摘要

本文介绍了笔者在做业务项目迁移的时候,处理外链逻辑以及对项目内的页面出入参和跳转场景进行统一化治理的思路,希望能给同样被历史项目和技术债折磨的同学们提供一些可行性建议

登录后可查看文章图片

阿里巴巴技术:破浪前行:iLogtail十年老架构如何浴火重生

摘要

本文总结了iLogtail整个架构升级的过程,分享了作者从接受任务时的迷茫,到最后升级基本完成时的喜悦,这半年多时间的一些经历和成长。

登录后可查看文章图片

netflix技术:Evolving from Rule-based Classifier: Machine Learning Powered Auto Remediation in Netflix Data Platform

摘要

Netflix开发了Auto Remediation功能,旨在自动修复失败的作业。该功能通过规则分类器和机器学习服务集成,可以处理由错误配置引起的错误,并分类新错误。Auto Remediation使用规则分类器进行初始分类,然后使用机器学习服务生成推荐配置。推荐配置存储于配置服务中,并自动应用。通过与Spark作业故障的生产部署验证了Auto Remediation的有效性和潜力。其优化器通过探索Spark配置参数空间来推荐最小化重试失败概率和成本的配置。预测模型每天离线重新训练,并在每个候选配置参数值上调用优化器进行评估。如果优化器找到可行的配置解决方案,响应中包含此推荐配置,由ConfigService用于更改重试的配置。如果没有可行的解决方案,响应中包含禁用重试的标记,从而消除了计算成本的浪费。训练时,使用了Feedforward Multilayer Perceptron (MLP)模型,将任务的元数据特征进行处理,并使用特征哈希和嵌入层进行建模。模型经过验证后存储在Metaflow Hosting中,然后由优化器根据每个配置请求进行调用。

登录后可查看文章图片

lyft技术:Python Upgrade Playbook

摘要

该文介绍了Lyft团队在Python升级方面的经验和做法。团队通过定期发送更新邮件和使用Slack渠道来分享和回答问题,以及利用新功能只能在较新版本的Python中使用来激励升级。团队成功升级了1500多个代码库,并且没有遇到重大问题,得益于他们优秀的CI和预发布环境。他们的升级速度越来越快,并且在其他重大项目的同时取得了进展。他们的工作也带来了其他好处,例如加快了开发流程和数据集的标准化。团队计划将他们的工具推广到整个基础架构,以跟踪所有升级和推广最佳实践。

登录后可查看文章图片

shopify技术:Improving Shopify App’s Performance

摘要

As an integral part of Shopify's ecosystem, our mobile app serves millions of merchants around the world every single day. It allows them to run their business from anywhere and offers vital insights…

登录后可查看文章图片

pinterest技术:User Action Sequence Modeling for Pinterest Ads Engagement Modeling

摘要

Yulin Lei | Senior Machine Learning Engineer; Kaili Zhang | Staff Machine Learning Engineer; Sharare Zahtabian | Machine Learning Engineer…

登录后可查看文章图片

netflix技术:Bending pause times to your will with Generational ZGC

摘要

The surprising and not so surprising benefits of generations in the Z Garbage Collector.

登录后可查看文章图片


‹ 2024-03-10 日报 2024-03-12 日报 ›

qrcode

关注公众号
接收推送