公司:哔哩哔哩
bilibili,音译哔哩哔哩,是总部位于中华人民共和国上海市的一个以ACG相关内容起家的弹幕视频分享网站,故简称及通称B站[f]。此外,bilibili的前身为视频分享网站Mikufans,并由网友“⑨bishi”(徐逸)于2009年6月26日创建。Mikufans建站的初衷是为用户提供一个稳定的弹幕视频分享网站,其后于2010年1月24日改为“bilibili”。
bilibili的内容随着发展渐渐不仅限于ACG,主要分区分为番剧、国创、放映厅、纪录片、漫画、专栏、直播、课堂、动画、音乐、舞蹈、游戏、知识、数码、生活、美食、VLOG、鬼畜、时尚、娱乐、影视、电影、电视剧、音频,除此之外亦有会员购、专题中心、全区排行榜、活动中心、能量加油站、社区中心、工坊集市、小黑屋、音乐PLUS、游戏中心(特指由哔哩哔哩代理登陆接口的游戏发布平台)、游戏赛事的区域。除了视频外哔哩哔哩还运营有《命运/冠位指定》、《崩坏学园2》等多部游戏。而现在网站标题中含有“( ゜- ゜)つロ 干杯~”的颜文字以做宣传。除此之外bilibili也被用户称为小破站、小电视。至2015年,75%的用户年龄在24岁以下,是年轻人的聚集地。
至2023年3月31日,B站月均活跃用户达3.15亿,移动端月均活跃用户达2.76亿,分别增加31%及33%。在用户健康增长的基础上,B站也在不断加快商业基础设施建设,提高社群服务管控能力。B站月均付费用户增长至2,720万,同比增长33%,付费率提升至9.3%。不过做大的同时,bilibili的成长空间也逐渐饱和,影视会员与视频业务在2022年营运呈现亏损扩大状态,年轻新人大量涌入却未能利用,而部分老用户指B站感觉变了,对现在的评论管理与风气感到不满,同时其up主也因为投稿不顺、分成不足等问题,开始出现部分停更现象。对此B站开始进行裁员降本增效,重新把精力投入游戏与商业制作上,项目2024年达到盈亏平衡。
2025 B站春晚直播——极速流式直转点在春晚项目中的实践
2025年春晚直播转点播项目中,技术团队通过优化最长路径、引入HLSv7协议、升级直播录制和转码系统,实现了从直播到点播的高效转换。新系统采用秒级分片和事件驱动的m3u8代理机制,显著提升了转码速度。春晚当天,4小时40分钟的晚会内容仅用8分钟完成点播稿件生产,相比优化前提速约5倍,成功达成业务目标。
2025 B站春晚直播——技术保障复盘
哔哩哔哩与央视合作,成为2025春晚独家弹幕互动平台。技术团队面临高并发、低容错的挑战,采取多级容灾体系、动态链路监控、红蓝对抗演练等策略,保障直播稳定。通过场景元信息平台、分级降级方案、资源弹性调配等手段,确保春晚四小时黄金时段万无一失,最终实现零定级事故的目标。
B站票务抢购下单流程演进
bilibili会员购票务系统通过三阶段优化,提升高并发抢购场景下的稳定性。初始版本同步处理事务,但高并发下性能瓶颈明显;异步下单版本解耦请求与事务,降低DB压力;最终采用Redis缓存扣减库存,优化用户体验与系统性能,成功应对大规模抢购需求,保障系统稳定运行。
大会员交易系统建设
大会员交易系统以模块化架构为核心,涵盖交易、订单、签约、商品及清结算等模块,确保高效灵活。系统通过事件驱动状态机管理订单生命周期,支持自动化对账和风控机制,保障数据一致性与安全性。前端统一营收支付SDK提供全流程支付服务,支持个性化定制。整体设计注重稳定性与扩展性,为业务创新与增长提供强劲动力。
猫耳大型活动提效——组件低代码化
猫耳前端通过引入低代码平台,优化了活动开发流程。日常活动由运营自主配置,释放了开发人力。针对复杂的大型直播活动,采用了远程组件技术,复用低代码组件,提升了开发效率。通过提前介入和模块化设计,前端能更专注于业务逻辑,减少了重复开发和后期维护需求,整体交付效率显著提高。
B站文生视频模型工程实践
OpenAI推出GPT-4和Sora模型后,B站TTV团队积极探索文生视频模型。文章详细介绍了OpenSora和CogVideoX的架构与训练流程,并分享了数据存储、预处理、模型并行优化等工程实践经验。团队通过HDFS+Alluxio方案提升数据加载效率,采用序列并行策略优化显存占用,并适配NPU架构以提升训练性能。未来计划引入流水线并行和分层ZERO3技术,进一步优化模型训练。
从 React 看前端 UI 代码范式革命
React引领了前端两次范式革命,从类组件到函数组件的转变,Hooks API的引入虽简化了状态管理,却带来了重复运行函数体的问题。其他框架如Solid.js和Vue.js通过信号和代理机制优化了Hooks的不足。未来,React可能进一步融合前后端代码,推动开发模式的创新。亲密性原则驱动着代码组织形式的不断演进,亲密代码应物理距离更近。
直播高光系统建设实践
直播回放的高光系统通过主动与被动触发机制生成直播精彩片段,结合AI优化提升内容质量。系统采用MySQL和Redis存储数据,支持高并发操作,并通过算法优化高光区间划分,确保片段连贯性。AI技术自动生成个性化标题,并对高光片段进行评分,提升用户体验。未来重点优化服务稳定性和治理工具建设,持续提升高光业务表现。
ClickHouse BSI与字典服务在B站商业化DMP中的应用实践
DMP(数据管理平台)为广告部门提供B站用户数据的管理。主要功能包括用户标签收集存储,标签市场建设,人群包圈选,人群画像分析,人群/特征定向几大功能模块。
其中人群包圈选和人群画像分析是两大核心功能。对设计,性能,扩展性,可维护性都有比较高的要求。也是本文中要讨论的ClickHouse技术的应用场景。在实践中,我们利用ClickHouse的bitmap相关功能,实现了人群包的实时预估和计算,也实现了人群包画像的分钟级计算。
基于流媒体点直播业务的算法赋能探索
B站通过算法优化流媒体业务,提升用户体验。点播业务中,利用XGBoost模型预测“头部稿件”,优化转码决策,节省存储和带宽。资源量化模型动态调整转码任务,提升资源利用率。转码耗时预估模型采用xdeepfm,误差小于5分钟。直播弹幕语义分析通过SBERT模型实时识别用户反馈,提升直播质量。各项算法赋能显著提升业务效率和用户满意度。
ICLR25 重新思考长尾识别中的分类器再训练:标签过平滑可以实现平衡
长尾数据分类面临多数类主导问题,解耦训练范式通过特征学习与分类器再训练分离取得进展。创新指标Logits Magnitude和Regularized Standard Deviation揭示了分类器优化的关键。提出的标签过度平滑(LOS)方法软化类间差异,有效抑制多数类干扰,在多个长尾数据集上实现最佳性能。
构建可扩展的智能体系统:工程化方法与实践(一)
AI在软件开发中日益重要,但大模型仍存在幻觉等问题。智能体系统通过模块化、自主决策等特性,提升AI应用的可靠性。本文以Code Review任务为例,探讨了从简单复制粘贴到使用LangChain框架构建智能体系统的全过程,分享了工程化方法与最佳实践,并分析了智能体系统面临的挑战与解决方案。
B站自研的第二代视频连麦系统(上)
本系列文章将从客户端、服务器和音视频编码优化三个层面介绍如何基于WebRTC构建视频连麦系统。B站开发的系统使用UDP协议确保低延迟,结合前向和后向纠错解决丢包问题,并动态调整码率和发送速率。通过标准API重构,提升维护性和兼容性。详细解析信令交换、选择性转发服务器和数据通道在连麦中的应用,支持多平台一致性操作。
视频 CDN 融合资源的调度策略探索落地
B站直播用户带宽需求增加,推动了对CDN边缘节点的优化。通过分层调度设计,将节点分为多个资源池,根据不同计费方式和用户需求优化带宽利用。采用区域借调策略解决供需不均,通过成本规划和启发式资源规划提高资源利用率。资源调度层进一步细化节点资源分配,确保每个业务有足够节点支持,提升直播稳定性和资源利用效率。
大模型推理加速的研究与分析
在2024年全球机器学习大会上,大模型推理效率成为关注焦点。推理面临高计算成本、内存需求及延迟与吞吐量的权衡等挑战,多模态任务加剧资源消耗。为应对这些问题,提出多层次优化策略,包括算子融合、量化技术、框架优化等。华为MindIE-LLM框架通过FlashAttention、Continuous Batching等技术显著提升推理性能,未来需探索更极致的压缩算法、硬件优化及异构加速策略。
CIKM'24 : 更快的批量KV查询系统
B站团队设计并实现了一种用于批量查询的分布式查询架构,显著提高了推荐系统的性能。