2025-01-02 16:30:00 ~ 2025-01-03 16:30:00
淘宝搜索的模型架构,经过多年持续不断的优化,已处于较为成熟的水平。然而,用户在搜索过程中偶尔会遇到体验不佳的问题。为了更好满足用户的购物体验,淘宝需要具备主动发现线上体验问题的能力。
淘天集团算法技术团队借助反作弊业务常用的异常检测思想,并结合AI大语言模型,将其应用在搜索体验巡查场景中,设计了ADLLM (Anomaly Detection/Adversial LLM) 框架。该框架可对搜索首页结果进行统一巡查,其相关性、丰富性、异常Query和商卡一致性的异常发现能力精度可达到93%以上。
该框架在算法上做到异常检测(Anomaly Detection),针对搜索大盘的真实日志和对抗模拟等方式,批量发现搜索结果“挂万漏一”的异常Case;同时在业务上做到对抗性(Adversial),对挖掘到的异常Case进行可解释性归类,并对搜索负向体验问题进行监控;同时为正向算法团队提供异常样本,协助学习更加鲁棒的模型。
树图布局(Tree Layout)是一种广泛应用于可视化领域的布局方式,主要用于表现具有 层次结构的数据。它通过层级化的父子关系或拓扑连接关系,清晰地展现各元素间的隶属关系。
在QCon上海2024大会上,小红书大模型团队分享了自研RLHF系统的设计和优化。本文将介绍,随着LLM的发展,超长文本、多模态、PPO(Proximal Policy Optimization)训练本身的复杂度等带来了巨大的技术挑战,AGI团队通过异构、同构组网架构以及一系列训推一体优化方案,全面超越开源框架,并展示了RLHF之后模型的效果提升。
随着多核处理器的普及和分布式计算的广泛应用,并发编程的重要性日益提升。尤其是在分布式系统中,多个线程和节点需要频繁地对共享资源进行并发访问,从而提升性能和吞吐量。然而,这也带来了线程安全、资源竞争等问题。为了应对这些问题,Java 提供了多种并发工具,其中 ReentrantReadWriteLock是一种专为高并发环境设计的锁机制,有效提升了读操作密集型场景下的系统性能。