知鸦日报2026-02-18

2026-02-17 16:30:00 ~ 2026-02-18 16:30:00

Technology

题拍拍技术:基于深度学习的扭曲文档图像校正方法

摘要

这周的技术早读聚焦于扭曲文档图像校正的深度学习方法。首先介绍了DocUNet,它通过堆叠U-Net网络实现端到端的扭曲校正,并提出了合成扭曲文档图像的方法。随后探讨了DewarpNet,它在DocUNet基础上引入3D形状建模,显著提升了校正效果和速度。两者都展示了深度学习在文档图像处理中的强大潜力。

pinterest技术:Drastically Reducing Out-of-Memory Errors in Apache Spark at Pinterest

摘要

Pinterest通过引入Auto Memory Retries功能,大幅减少了Spark应用中的内存溢出(OOM)错误。该功能自动识别高内存需求任务,并在更大执行器上重试,使内存配置无需为最大需求调整,而是基于P90内存使用。实施后,OOM故障率下降了96%,显著降低了平台成本和运维压力,同时支持了平台的有机增长。

登录后可查看文章图片


‹ 2026-02-17 日报 2026-02-19 日报 ›

qrcode

关注公众号
接收推送