公司:小红书
小红书,是中华人民共和国的网络购物和社交平台,成立于2013年6月,该网站声称截至2019年1月拥有2亿用户。在小红书社区有桌面跟手机端,信息以瀑布流(Pinterest-style layout)的方式呈现,但又结合视频与直播功能,用户还可以分享产品评测和旅游目的地的文字介绍,即“种草笔记”。该软件被视为中国改良版的instagram,用户相对年轻而受教育,细分的化妆品搜索功能成功打入购物市场,同时透过素人跟口碑来创造体验旅游消费真实感,尤其对于新博主曝光度相对友善、但也有容易盗用个人照的质疑,另外,小红书也为网络和电视的多个节目冠名赞助,为小红书带来用户和内容的增长。
高兼容低成本,开箱即用的首页性能优化方式被我们找到了
2020年初,小红书首页 UI 的复杂度显著提升,在优化布局 xml 和使用一些 stub 方式的同时,我们也在寻找一些成本更低、性能更好的方式。
X2C 是当时业界熟知的一种优化方式,其原理是编译期将 xml 翻译成代码,可以有效避免反射以及读取资源文件的损耗。由于小红书 APP 中存在着很多自定义 View 的场景,X2C 同时也会带来较高的维护成本。
经过对 LayoutInflater 耗时的深入分析,我们找到了可以兼容各种 View 场景的 APT 方案。这一方案既避免了反射所带来的损耗,也不会增加额外的维护成本,成为了一个开箱即用的工具。
防治“虚假种草”,小红书技术团队干了这几件大事
作为一个内容社区,小红书月活用户数自2021年10月突破2亿后一直稳步增长。围绕不断累积的UGC内容资产,小红书正在成为越来越多用户的多元生活方式聚集地。这些都让小红书成为了刷量黑产的目标。
从用户维度来看,安全在内容平台上要解决两个问题:保证用户的信息在网络上是安全的,以及保障用户在网络上获取的信息是真实的。
刷量,作为社区及交易中常见的作弊手段,会导致用户获取的信息不真实。通过刷量这种方式所获得的无论是笔记阅读、点赞、评论等社区流量,或是商品浏览、销量等电商数据,都会瓦解我们的内容安全,影响用户对平台的信赖。
如何用紧凑型语音表征打造高性能语音合成系统
小红书多媒体智能算法团队和香港中文大学首次联合提出了基于多阶段多码本紧凑型语音表征的高性能语音合成方案 MSMC-TTS。基于矢量量化变分自编码器(VQ-VAE)的特征分析器采用若干码本对声学特征进行阶段式编码,形成一组具有不同时间分辨率的隐序列集合。这些隐序列可以由多阶段预测器从文本中预测获得,并且通过神经声码器转换成目标音频。该方案,对比基于Mel-Spectrogram的Fastspeech 基线系统,音质和自然度有明显的改善。该工作现已总结成论文 “A Multi-Stage Multi-Codebook VQ-VAE Approach to High-Performance Neural TTS”,并被语音领域会议 INTERSPEECH 2022 接收。
互联网都在说降本增效,小红书技术团队是怎么做的?
随着小红书业务的快速发展,资源消耗和成本压力显著增加。在降本增效的大背景下,我们建设了性能持续优化 & 追踪平台,来系统性辅助业务团队解决性能问题,在业务系统日常的演化过程中,持续跟进、追踪系统的性能退化并推动优化。
目前,这一平台已覆盖小红书搜索、推荐、广告的 S0 服务,运行两个多月以来,辅助业务团队存量优化超1万 CPU 核;发现性能退化超1万 CPU 核并跟进优化。
首次解密小红书“种草”机制:大规模深度学习系统技术是如何应用的
AI 引领的新一代信息技术,正驱动新一轮科技浪潮席卷而来。作为近年来国内发展最为迅速的移动互联网平台之一,小红书乘势而上,目前已经形成了以图文和短视频内容为主的超大型 UGC 社区。在这个独特而活跃的社区里,每天都会产生海量多模态数据及用户行为反馈,催生出兼具价值与挑战的新问题。
当前,大规模深度学习系统正发生着许多令人兴奋的进展。10 月 15 日“小红书 REDtech 青年技术沙龙”活动中,小红书技术副总裁凯奇进行了《大规模深度学习系统技术及其在小红书的应用》分享,为我们揭开 LarC 的“神秘面纱”。
程序员如何打破需求魔咒:为什么人越招越多,活越干越累?
在“永远做不完的需求”面前如何沟通和取舍?
那些水平很棒的技术人为什么在创业后常常碰的头破血流?
为什么说技术 leader 都要能做自己-2的事情?
团队越大干实事的人越少怎么破?
AI 技术的红利吃到尽头了吗?
算法工程师以后会不“香”了?
“工程师文化”就是“衣着休闲、时间自由、不修边幅、免费三餐和华丽装修”吗?
小红书“薯条”业务竞价策略及最优公式详解
薯条广告业务作为小红书商业化中重要的一部分,可以让内容创作者和企业商家轻松使用手机 app 进行笔记推广和广告投放。虽然从用户视角来看,薯条广告的投放方式简单便捷,但从平台视角来看却面临着很多挑战。如何在薯条广告和其他广告的竞争过程中,合理分配小红书的商业化流量,最大化广告主和平台的整体收益,需要深入地思考和探索。对此,小红书商业技术团队从策略视角出发,对薯条竞价广告的投放进行建模,推导出理论最优解法,再结合业务实践,思考出简单有效的调控方案,让薯条广告业务快速达到了预期水准,推动了商业化平台的发展。
研究100+小红书热门标题,我总结小红书标题的万能公式。
如何写小红书标题?怎样一秒抓住用户注意力,这是小伙伴常咨询的问题。
回答这个问题前,先来说一下标题的基础和作用,小红书标题上限是20个字,大概是封面1/5,可以这样理解,封面是第一刺激力,标题承担第二刺激力,另外标题作为笔记文案中权重最高的部分,承担着笔记的搜索展现功能。
再来说如何写标题,我拆解小红书5大热门品类(穿搭,宠物,食品,婚摄,家居),通过艺恩星数近筛选30天高互动量笔记,按照互动量排行导出前20条笔记,将互动跟标题关联性不大的剔除掉,先来研究每一个品类标题的特点。
电商黄牛,你被小红书盯上了
随着小红书社区电商业务的发展,营销类型不断丰富,覆盖的用户及场景随之增加,黄牛的抢购手段也逐渐复杂多样。除了长期存在的同人聚集性购买热销商品的方式,还衍生出了众包形式的抢购——即通过邀请真人用户代为购买让利商品,转寄继而到货后转账的方式来获取货物和差价收益。
此类黄牛行为不仅会给平台带来损失,还会持续影响普通用户以及商家的权益。为保护用户和商家的利益,小红书反作弊团队一直在持续地通过各种手段与黄牛进行对抗,并从中沉淀出了高效、可执行、可实现的图计算算法模型。
速度与安全可兼得!改造异步布局大幅提升客户端布局性能
AsyncLayoutInflater 是 Android 官方出品的一个提供异步 inflate 布局的工具,为在布局的性能优化上提供了新的思路。本文介绍了小红书在使用以及改造这个工具上的经验,希望能和大家一起探讨更多的优化方式。
小红书自研小程序:电商体验与效果优化的运行时体系设计
小程序在其诞生后的几年内,凭借其简单、轻量、流畅、无需安装等特点,引来了爆发式的增长。伴随小红书电商业务的发展,我们洞察到越来越多的商家和品牌大客户有自己定制化需求场景,传统的电商和薯店存在下面三大问题:高运营成本、无法个性化定制、电商行业的兼容性。
为了解决上述问题,并快速打通基于小红书体系的支付与账号体系。过去的一年内,我们踏上了自研小程序之路。目前,在小红书店铺主页、 笔记详情、品牌专区、开屏均可唤起小程序。
本文将主要介绍小红书进行小程序自研时的一些业务背景及工程化、容器能力的落地方案,以及运行时针对双线程架构 bridge,framework 能力的设计。
小红书自研KV存储架构如何实现万亿量级存储与跨云多活
RedKV是小红书自研的一款基于NVMeSSD的分布式NoSQL KV存储系统,支持无中心和有中心的两种管控架构,旨在解决公司内实时落盘的KV存储需求。RedKV1.0基于Gossip协议做节点管理,在全公司已经大规模使用,实时QPS接近1亿/秒,存储量在数PB级别。RedKV2.0采用中心Shard管理架构,支持全球多云多副本在线弹性伸缩,异地容灾和服务秒级切换。
通过分层优化,RedKV对比开源同类产品,聚合写吞吐能力平均提升3倍,读1.5倍;对标HBase,成本优化近40%。RedKV部分兼容Redis协议,string/hash/zset等主要数据类型很好的的支持了公司的绝大部分在线存储业务,优化了早期Redis集群部署产生的成本问题以及HBase带来的性能及稳定性问题。RedKV和Hive数仓的数据互通能力为离线数据业务提供了一种解决方案。
何以至简:小红书的交互设计分析
小红书的交互设计,是如何做到简单的?
「蕃茄蛋」罗锴:专注B站和小红书,从零做达人孵化
蕃茄蛋是一家从零开始做达人孵化的MCN机构,且专注年轻人聚集的B站和小红书,并在实践中摸索出「先B站,再小红书」的达人成长路径。目前旗下有自孵化达人超200位,包括B站知名UP主@欧阳春晓 ,@妮可蹦蹦 ,@钢铁直男必老板 ,小红书博主@HiyaSony 等。
之所以选择从零孵化达人,并以B站为起点,客观原因是创始团队此前没有MCN领域的相关经验,只能通过从零孵化达人以证明自己。此外,他们认为B站相对而言更注重内容,与蕃茄蛋团队的基因契合,且当时抖音上的达人竞争已经很激烈,对新入局者来说不太友好。
离不开,管不好,代写产业链让小红书很尴尬
新消费品牌冷启动的阵地,还能支撑多久?
精细化的小红书,年轻人的出游神器
未来,小红书同样得到视频内容加持,内容生态会发生怎样的变化?