公司：作业帮的相关资料

作业帮基于 DolphinScheduler 的数据开发平台实践

随着任务数量、任务类型需求不断增长，对我们的数据开发平台提出了更高的要求。本文主要分享我们将调度引擎升级到Apache DolphinScheduler 的实践经验，以及对数据开发平台的一些思考。

作业帮技术

作业帮数据库智能运维实践

为了提高效率和稳定性，团队耗费大量时间和精力打造了"journey"数据库智能运维平台，它基本覆盖了各个数据库类型的整个生命周期的各个活动。这使得我们能够更快速地响应需求，并确保服务的稳定运行。

作业帮技术

Stored-作业帮自研NoSQL数据库

为支撑在线业务的海量缓存需求及复杂IO场景，以更低的成本承载更大规模的流量及数据。

作业帮技术

如何创造有灵魂的动画

我们通过mVideoTracker调研以及爱奇艺、优酷动漫排行榜共计采样了25个案例，通过整理发现，使用类型较多的有「冒险」（7/25）、「热血」（6/25）「搞笑」（5/25）。由此得出以下结论：「冒险」、「热血」、「搞笑」类型相对来说更受欢迎。

作业帮产品

小数据量语音合成技术在作业帮的应用

语音合成是将文字内容转化成人耳可感知音频的技术手段，传统的语音合成方案有两类：基于波形串联拼接的方法和基于统计参数的方法。随着深度学习的发展以及计算能力的不断提升，基于神经网络的语音合成方案逐步成为语音合成领域的研究热点。

相较于传统的语音合成方案来说，基于神经网络的语音合成技术最大的特点就是结构简单。端到端的语音合成方案可以直接输入文本或者字符，合成系统就能将与之对应的音频波形直接输出，降低了开发者对语言学和声学知识的掌握要求，同时该方案下生成的音频无论拟人化程度，还是对原始录音数据情感风格的还原情况都远优于传统方案。

作业帮技术

作业帮多云架构设计与实践

业界多云选型有很多种，怎么选择适合业务发展的方案呢？从多云核心价值思考，我们重点关注的能力指标，无外乎就这几个：灾难恢复、故障转移、成本优化、避免锁定、数据主权、特定访问。

主动学习技术在作业帮业务场景中的创新与实践

如何少标数据，但又兼顾不确定性和多样性。

作业帮技术

K12在线课堂-趣味化互动题解析

一次回归课中教学互动的全新体验升级，直播课小学设计团队是如何打造出一堂生动有趣、寓教于乐的课程体验的呢？

作业帮产品

百分运动app的诞生之设计体验探索

设计师从用户的视角剖析运动需求的本质，满足用户不同阶段的诉求，本文将带你了解设计师怎样对学生运动场景探索与尝试的过程中发挥自己的价值。

作业帮产品

作业帮多云网络的探索与实践

谈到多云建设，多云互通是绕不开的话题，也是多云架构能取得成功的关键基石。

作业帮从成立之初就一直扎根在公有云上，没有自建机房，即使是工区的办公服务95%以上也都实现了云化部署。在作业帮的多云网络建设过程中，历经多次架构重塑，最终摸索出一套双环星型组网+CPE管控的多云网络互通方案。本文将会通过「网络建设」、「质量提升」、「持续运营」三个阶段来介绍作业帮网络团队在多云网络建设过程中的探索与实践。

作业帮技术

智能学习硬件设计之手表篇

经过一年的努力，作业帮智能团队积累了包括智能学习笔，智能学习桌，智能学习手表等丰富品类，今天跟大家聊聊智能学习硬件的主角之一-智能手表的设计过程，包括设计目标确定，行业洞察，用户洞察以及设计策略制定和拆解，以及最后成果的呈现。

作业帮产品

600+服务模块，1万+POD数量，作业帮从PHP迁移至Go实战总结

作业帮初期因业务快速发展，服务端采用 PHP 语言作为主要开发语言，很好支撑了业务快速的迭代发展。

BERT能否被“平替”？作业帮文本分类场景下的一次尝试

近年来，在众多自然语言处理模型中最具有代表性的就是BERT，它以优异的性能赢得了广大算法工程师的青睐。但是，在有些生产环境中，BERT庞大的参数量不仅在推理时占用过多的计算资源，也不利于后续模型的扩展迭代。

作业帮的业务体量较大，每天会生产大量的文本数据。这些数据均需要经过自然语言处理模型来生成业务可以直接使用的文本分类标签。在实际生产阶段，我们的场景具有如下特点：

标签分了多期进行建设和产出，每期的标签在不同的场景有不同的阈值；
每个时期的标签之间既存在独立性又存在依赖性；
每个时期的有监督数据较少，一般的机器学习模型很难取得较好的线上效果，因此每一期的标签都是基于BERT进行fine-tune和部署。

目前我们的模型训练及部署流程如上图所示。结合作业帮的实际业务场景特点和使用方式，我们面临如下问题：

1)每当新的任务需求提出后，都需要对BERT进行微调来满足。

2)随着任务数量的增加，服务器上部署的BERT数量也会不断上升，导致占用较多的GPU计算资源，而且任务之间的调度也会变得更加复杂。

因此，本文将以上述场景作为对象，探讨在研究平替BERT过程中的发现和结果，并对比它们的各项性能指标。最终目标是找到一个和BERT推理效果基本持平，但占用更少计算资源（特别是减少GPU计算资源），同时具有优秀扩展性的解决方案。

作业帮技术

SRE运维思考与实践

拒绝重复挖坑，用工程化的思路和方法来定义和重构运维。

作业帮技术

作业帮GO应用框架实践

作业帮初期因业务快速发展，服务端采用PHP语言作为主要开发语言，很好支撑了业务快速的迭代发展。但随着业务发展，以ODP为代表的PHP服务端技术栈遇到了一些问题，主要是：

·微服务架构支持欠缺：ODP通过PHPLIB耦合服务，类单体架构，服务间边界模糊，框架全局部署且缺乏现代包管理工具。

·性能/成本瓶颈：PHP缺乏线程/协程支持，资源使用率高，业务成本大，在高并发、高性能的部分场景与GO有一定差距。

·云原生适配不足：云原生带来的技术红利，比如容器化、服务治理、devops、服务观测，PHP的适配度低，比如FPM fastcgi在原生mesh的支持上及CD上过多耦合。

所以作业帮选择了GO作为主推的服务端开发语言来替代PHP。作业帮GO语言框架zgin是基于gin衍生而来，是面向web服务的开发框架，提供了开箱即用的常用组件和功能，侧重通用性和稳定性，兼顾性能和时延，构建了符合公司业务场景的生态体系。

作业帮技术

更好的中英文混合语音识别系统

语音作为人与人交流的直接媒介，承载着人们日常生活中的大部分信息来源。基于近年来通信技术与物联网的发展，各式各样的语音助手、智能家具等软硬件层出不穷，人机交互技术的发展及人们对其需求日益攀升。语音识别技术在人机交互上扮演着重要的角色，任何因其导致的识别错误都可能在人机交互系统中的各个模块上传播，并最终导致交互失败。因此针对语音识别的研究具有重要的学术价值和应用价值。

混合语言现象常常出现在能够流利使用多种语言的群体中。英文作为全球的通用语言，就时常以各种形式与其他语言混合在一起。然而现有的大多数最先进的语音识别系统都专注于单语种语音识别，即它们一次只能处理一种语言，这样的系统无法识别中英混合语言的语音。随着语音技术开始渗透到人类生活的方方面面，混合语言的现象受到越来越多的关注。因此，开发用于中英文混合语言的自动语音识别(CSSR)系统尤为重要。

作业帮技术