知鸦日报2021-05-15

2021-05-14 16:30:00 ~ 2021-05-15 16:30:00

技术

netflix技术:Achieving observability in async workflows

摘要

在异步工作流中实现可观察性。

知乎技术:基于 AC 自动机和贝叶斯方法的垃圾内容识别

摘要

作为一个开放领域的知识社交平台,知乎为大家提供了「友善」、「理性」、「专业」的讨论氛围,吸引了大量用户参与,产生了很多优质内容。但同时也吸引了一些垃圾制造者,在知乎上生产了不少的垃圾内容,如「违法」、「广告」、「淫秽色情」、「人身攻击」等,严重影响了知乎用户的正常讨论交流,极大地影响了用户体验,同时也对社区管理造成了较大的干扰。

知乎技术:Draft.js 在知乎的实践

摘要

Draft.js 适合用来解决知乎 Web 端富文本相关的问题,场景包括:

  • 提问/回答/写文章这类带格式、段落的文本;
  • 支持 @、超链接的评论;
  • 支持换行的个人简介、私信。

从流行的编辑器架构聊聊富文本编辑器的困境

摘要

contenteditable is terrible, 但是编辑器已经最小化了对它的使用,比之更为严峻的是,操作系统、浏览器、输入法相互组合形成的紊乱生态 —— 一个编辑器无法控制的,但产品又期望在上面开出繁花的生态。所以才说,Web 富文本编辑器是前端的天坑之一。

pinterest技术:How Pinterest Fights Spam Using Machine Learning

摘要

数以亿计的人定期访问Pinterest,在数十亿的Pins中直观地发现鼓舞人心的想法。灵感是一个很高的标准,我们必须保持警惕,确保品客不会看到垃圾邮件、有害内容或错误信息。为了执行我们的社区政策并维持一个鼓舞人心的环境,我们使用最新的机器学习技术来建立自动化系统,迅速检测并打击垃圾邮件内容和垃圾邮件发送者。

我们的反垃圾邮件系统由反应性和主动性两部分组成,以有效对抗对抗性滥用者--那些故意试图逃避系统的用户。我们的主动式系统由复杂的机器学习模型组成,而被动式系统包括在实时规则引擎中执行的规则和轻量级机器学习模型。我们不仅使用最新的建模技术,而且通过添加新的数据和探索新的技术突破,定期对这些模型进行迭代,以便随着时间的推移保持或提高其性能,从而有效解决垃圾邮件。

字节跳动技术:汉字描红在Flutter侧的落地

摘要

汉字自动描红是 大力爱辅导-语文字词专项 中的重要功能部分。前期技术调研阶段发现,公司内部已经存在能够满足需求效果的Native SDK,但是考虑到以下原因:

  1. 字词专项的技术选型是Flutter作为主要实现
  2. 汉字绘制或者描红的需求在多功能、多界面中出现
  3. 大量使用PlatformView对Flutter界面的性能有较大伤害 最终决定,使用Flutter实现一套汉字自动描红的方案,便于集成和后续相似功能迭代。

58同城技术:Flutter代码覆盖率研究

摘要

Android java代码覆盖有Jacoco等工具,iOS也有对应的原生代码覆盖率工具,然而,目前尚未有任何关于Flutter覆盖率的工具或者插件等,属于空白区域,因此需要从无到有的开发该工具,本文将详细说明Flutter代码覆盖率该工具的原理及其实现。

滴滴技术:滴滴出行平台业务架构演进

摘要

为了满足不同用户在价格、体验等方面的差异化诉求,滴滴提供了越来越丰富的品类,这些品类大体流程是类似的,在一些细节体验上有差异,一套架构如何兼顾隔离和复用,同时支持这些品类,且看滴滴服务端技术的湾流平台怎么做。

有赞技术:微信小程序自动化框架minium实践

摘要

精选小程序发生了一次线上问题,测试阶段的小程序开发码测试ok,但是小程序正式码由于打包问题,"我的订单"页面文件打包失败,导致线上用户访问我的页面白屏。

当前并不能避免该打包问题,为了规避异常版本发布至线上,需要在预发、体验码发布、正式码发布等各阶段进行主流程回归。手动回归测试非常耗时,在发布前的各阶段,测试人员须重复执行大量测试用例,以确保本次上线功能OK且对其他功能无影响。

一遍又一遍执行相同的测试用例,不仅要花费更多的时间,而且还会降低整体测试效率,因此引入微信小程序自动化以解放重复人力。

字节跳动技术:汉字笔顺动画技术剖析

摘要

汉字笔顺动画是常见的语文教育需求,我们导入网上开源的 Hanzi Writter 并部署编辑器,应用在大力智能作业灯上。在原版前端实现基础上我们扩展了 Android 和 iOS 端实现,提供更优化的笔顺动画性能。增强对笔顺绘制的控制能力,实现了指定笔顺/笔段渲染,支持笔顺批改和描红能力。

哈啰技术:基于ClickHouse的用户行为分析系统

摘要

本文分享的是一个“亿级数据秒级分析”。包括但不限于介绍用户行为分析系统的组成、ClickHouse集群的部署、从Hive到ClickHouse的推数、用户数据及建表以及五种行为分析等。


‹ 2021-05-14 日报 2021-05-16 日报 ›

qrcode

关注公众号
接收推送