知鸦日报2025-01-03

2025-01-02 16:30:00 ~ 2025-01-03 16:30:00

技术

哔哩哔哩技术:Apache Celeborn 在B站的生产实践

摘要

随着B站业务的飞速发展,数据规模呈指数级增长,计算集群也逐步从单机房扩展到多机房部署模式。

Apache Celeborn 在B站的生产实践

携程技术:携程基于Kafka的数据校验代理在FinOps领域的应用

摘要

提升数据质量,构建度量及治理自助化自动化实践。

携程基于Kafka的数据校验代理在FinOps领域的应用

京东技术:实现“代码可视化”需要了解的前置知识-编译器前端

摘要

“代码可视化”的概念定义和业界案例在前文中已经进行了讲述,综述可阅读浅析“代码可视化”,更多相关知识可查看专栏“代码可视化”。

实现“代码可视化”需要了解的前置知识-编译器前端

京东技术:架构提效的矛盾和矛盾的主要方面

摘要

本文将从稳定、性能、代码三大维度出发,结合实战经验,探讨如何有效提升架构效能。

架构提效的矛盾和矛盾的主要方面

美团技术:鸿蒙应用签名实操及机制探究

摘要

本文对鸿蒙公开资料进行了深入分析和解读,梳理了鸿蒙单框架应用的签名机制,拆解每一步的实操过程和背后的实现原理,并对源码分析整理签名的校验机制。

鸿蒙应用签名实操及机制探究

快手技术:你不可错过的动效转换服务!

摘要

本篇文章介绍了动效多格式转换能力背后的技术实现。

你不可错过的动效转换服务!

阿里巴巴技术:大模型加持淘宝搜索体验巡查,异常发现精度达93%

摘要

淘宝搜索的模型架构,经过多年持续不断的优化,已处于较为成熟的水平。然而,用户在搜索过程中偶尔会遇到体验不佳的问题。为了更好满足用户的购物体验,淘宝需要具备主动发现线上体验问题的能力。

淘天集团算法技术团队借助反作弊业务常用的异常检测思想,并结合AI大语言模型,将其应用在搜索体验巡查场景中,设计了ADLLM (Anomaly Detection/Adversial LLM) 框架。该框架可对搜索首页结果进行统一巡查,其相关性、丰富性、异常Query和商卡一致性的异常发现能力精度可达到93%以上。

该框架在算法上做到异常检测(Anomaly Detection),针对搜索大盘的真实日志和对抗模拟等方式,批量发现搜索结果“挂万漏一”的异常Case;同时在业务上做到对抗性(Adversial),对挖掘到的异常Case进行可解释性归类,并对搜索负向体验问题进行监控;同时为正向算法团队提供异常样本,协助学习更加鲁棒的模型。

大模型加持淘宝搜索体验巡查,异常发现精度达93%

图布局算法 | 详解树状布局(Tree)

摘要

树图布局(Tree Layout)是一种广泛应用于可视化领域的布局方式,主要用于表现具有 层次结构的数据。它通过层级化的父子关系或拓扑连接关系,清晰地展现各元素间的隶属关系。

图布局算法 |  详解树状布局(Tree)

小红书技术:从0到1构建RLHF系统——小红书大模型团队的探索与实践

摘要

在QCon上海2024大会上,小红书大模型团队分享了自研RLHF系统的设计和优化。本文将介绍,随着LLM的发展,超长文本、多模态、PPO(Proximal Policy Optimization)训练本身的复杂度等带来了巨大的技术挑战,AGI团队通过异构、同构组网架构以及一系列训推一体优化方案,全面超越开源框架,并展示了RLHF之后模型的效果提升。

从0到1构建RLHF系统——小红书大模型团队的探索与实践

360技术:ReentrantReadWriteLock基本原理以及在Yarn中的应用

摘要

随着多核处理器的普及和分布式计算的广泛应用,并发编程的重要性日益提升。尤其是在分布式系统中,多个线程和节点需要频繁地对共享资源进行并发访问,从而提升性能和吞吐量。然而,这也带来了线程安全、资源竞争等问题。为了应对这些问题,Java 提供了多种并发工具,其中 ReentrantReadWriteLock是一种专为高并发环境设计的锁机制,有效提升了读操作密集型场景下的系统性能。

ReentrantReadWriteLock基本原理以及在Yarn中的应用

‹ 2025-01-02 日报 2025-01-04 日报 ›