公司:百度
ClickHouse在百度MEG数据中台的落地和优化
在百度MEG数据中台构建的图灵3.0生态以及OneData+开发范式中,TDE-ClickHouse作为重要的基础引擎之一,我们主要从查询性能、数据导入和分布式架构三个方面对其进行了相应优化。
用增结算数仓化改造:在/离线调度系统的构建与应用
从业务角度出发的平台架构变革。
百度优选—黄金购买链路体验升级
设计针对百度APP场域多、流量类型复杂的特殊情况,推进黄金购买链路框架、流程、页面全线升级。
百度视觉搜索架构演进实践
本文介绍了百度视觉搜索如何通过技术栈升级、架构能力提升以及稳定性建设等手段实现全链路架构演进,以应对业务和技术面临的新挑战。
百度搜索结果波动的极致治理
百度搜索系统通过创新的数据打平技术和自动化分析机制,成功量化并捕获了影响搜索结果一致性的关键特征与因素,为系统优化提供了精确指导,显著降低了结果波动。
百度Android IM SDK组件能力建设及应用
本文主要介绍了百度IM SDK的建设背景、主要工作流程、建设过程遇到的问题和解决方案。
大模型在研发数据中台的应用实践
利用大小模型结合的方式,构建多个智能体,提升业务在APP性能追踪定位的效率。
百度搜索的RLHF性能优化实践
本文介绍了搜索从工程视角对大模型RLHF任务的分析与性能优化工作。
Embedding空间中的时序异常检测
在Embedding空间中实现高效的时序异常检测,通过向量化技术捕捉用户行为变化,有效应对复杂业务场景下的异常流量检测。
读友好的缓存淘汰算法
本文探讨了引入缓存解决高访盘吞吐的长尾。
微服务架构革新:百度Jarvis2.0与云原生技术的力量
百度Jarvis2.0,十年磨一剑,以云原生微服务托管平台引领广告业务系统架构革新,实现微服务治理与DevOps的高效融合。
如何定量分析 Llama 3,大模型系统工程师视角的 Transformer 架构
主要从工程师的视角来剖析 Transformer 的整体架构,主要分 4 个部分:
- 第 1 部分会介绍一些基础知识,帮助大家对后面讨论的内容做个铺垫。
- 第 2 部分是对 Transformer 架构的定量分析,也是今天分享的重点。在这个部分我会把 Transformer 架构打开,告诉大家它内部做了什么事情,并针对该模型做了一些定量分析,进而形成一些量化的结论。
- 第 3 部分我们会展示一些目前比较热门的 Transformer 架构变种,并从架构的视角来分析各个变种的效果和优化点。
- 第 4 部分是对一些实际案例进行分析,通过实战更好地让大家对大模型的性能和相关问题有更深入的理解。
财务记账系统中高频热点账户的研究
本文在结算系统升级到了2.0,搭建了一个基于账户余额的财务系统的基础上,讨论了财务系统中较为常见的高频热点账户的现象,研究并给出了一些解决方案,并对不同的解决方案进行对比,给出不同业务场景下适用的解决方案。
百度智能云将大模型引入网络故障定位的智能运维实践
物理网络中,某个设备发生故障,可能会引起一系列指标异常的告警。如何在短时间内从这些告警信息中找到真正的故障原因,犹如大海捞针,对于运维团队是一件很有挑战的事情。
在长期的物理网络运维工作建设中,百度智能云通过各种平台数据的综合分析实现了快速故障定位。近期,更是将大模型成功引入物理网络的故障定位中。相比过去传统的定位分析方法,大模型给网络故障定位的能力建设带来了很多改变。
百度Feed稳定性架构实践
面对数十亿的在线请求流量,如何保证系统的高可用?
百度推荐排序技术的思考与实践
本文主要介绍了百度在推荐排序方面的思考与实践,以及特征、算法和架构三个角度的介绍。百度采用了离散化特征设计,平衡了记忆和泛化效果,特别是对头部用户和稀疏长尾的处理方式不同。文章强调了用户的点击和消费决策序列在模型设计中的重要性。百度通过分层设计和联训提高模型效率,采用弹性计算法保证模型复杂性和性能。精排模型精度高,重排模型在此基础上做list wise。百度希望通过这些措施实现推荐公平和数据分布的平衡。