公司:小红书
小红书,是中华人民共和国的网络购物和社交平台,成立于2013年6月,该网站声称截至2019年1月拥有2亿用户。在小红书社区有桌面跟手机端,信息以瀑布流(Pinterest-style layout)的方式呈现,但又结合视频与直播功能,用户还可以分享产品评测和旅游目的地的文字介绍,即“种草笔记”。该软件被视为中国改良版的instagram,用户相对年轻而受教育,细分的化妆品搜索功能成功打入购物市场,同时透过素人跟口碑来创造体验旅游消费真实感,尤其对于新博主曝光度相对友善、但也有容易盗用个人照的质疑,另外,小红书也为网络和电视的多个节目冠名赞助,为小红书带来用户和内容的增长。
小红书搜索广告团队提出幻觉检测新方法:基于语义图增强的不确定建模
如何低成本提升大模型幻觉检测能力?
从0到1构建RLHF系统——小红书大模型团队的探索与实践
在QCon上海2024大会上,小红书大模型团队分享了自研RLHF系统的设计和优化。本文将介绍,随着LLM的发展,超长文本、多模态、PPO(Proximal Policy Optimization)训练本身的复杂度等带来了巨大的技术挑战,AGI团队通过异构、同构组网架构以及一系列训推一体优化方案,全面超越开源框架,并展示了RLHF之后模型的效果提升。
小红书MySQL数据一致性校验能力探索与实践
数据一致性校验如何在小红书实践并落地。
Apache Pulsar在小红书在线场景下的探索与实践
Pulsar在小红书在线消息队列的场景下如何落地。
小红书提出大模型推理加速算法 HASS 刷新 SOTA
聚焦草稿模型训练与解码间差异,强化两者在目标和上下文上对齐。
AIOps在小红书的探索与实践——故障定位与诊断
微服务智能根因定位系统,帮助业务故障快速定位。
多模态对齐在小红书推荐的研究及应用
小红书提出新型多模态推荐的对齐和训练框架AlignRec。
小红书推出AIGC加速新算法TDD
由目标驱动蒸馏,文生图精准加速。
探索可观测的新视角—— eBPF 在小红书的实践
深度解析 eBPF 技术在小红书大规模落地的实践。
AIGC 赋能展示广告:大模型在小红书标题生成中的深度实践
深度剖析大模型在多样化广告创意生成中的实践。
小红书推荐系统迭代:AB测试架构的高效与稳定性策略
小红书的 AB 平台采用 SDK 分流的方式,实验的分流逻辑是内置在推荐服务中的。一个请求通过网关后,会打到推荐服务上,实验 SDK 通过一个设定好的机制定期拉取实验配置,并做一些打点采集的工作。
小红书训推异构引擎的设计与应用
近年来小红书业务一直保持高速增长,日均曝光、互动 UV 和日均搜索量都达到了非常高的水平。
从模型工程的角度来看,面临的主要挑战包括:
-
首先,随着模型的复杂度增加,其处理的数据量也越来越大;
-
其次,计算流程的需求也会随之增长;
-
此外,模型的应用场景也越来越广泛,不仅限于传统的搜索广告和推荐,还包括电商和直播等新业务。
面对业务高速增长带来的挑战,我们需要通过引擎技术有效降低成本,并为业务提供迭代空间。
语义与效率、算法与算力双飞轮——小红书广告召回实践
小红书作为一个集内容分享、社区互动与电商购物于一体的平台,其搜索功能已成为人们获取信息、做出消费决策的重要渠道。随着用户需求的多样化和广告物料的快速增长,小红书搜索广告召回系统面临着业务与技术上的多重挑战。
本文深入探讨了小红书在业务增长阶段的搜索广告召回实践与思考,通过召回水位分析与策略演进,介绍了如何通过构建数据循环、优化复杂召回模型等技术手段,在保证用户体验的同时实现广告的高效分发。
此外,大模型技术的应用,如复杂查询常识推理、大模型表征等,也为召回系统带来了新的突破。在大模型时代,搜索技术栈的变革将不可避免,小红书搜索广告召回协同算力引擎团队已经为未来做好了准备。
有流量没转化?如何写出小红书高转化笔记?
为什么有流量没转化?如何撰写小红书高转化笔记?
时延降低 50%,小红书图数据库如何实现多跳查询性能大幅提升
小红书图数据库 REDgraph 在分布式并行查询上的探索。
小红书云原生 Kafka 技术剖析:分层存储与弹性伸缩
存储成本直降 60%,运维效率增至 10 倍,打造「弹性伸缩、按量付费」商品化模式