公司:百度
百度搜索结果波动的极致治理
百度搜索系统通过创新的数据打平技术和自动化分析机制,成功量化并捕获了影响搜索结果一致性的关键特征与因素,为系统优化提供了精确指导,显著降低了结果波动。
百度Android IM SDK组件能力建设及应用
本文主要介绍了百度IM SDK的建设背景、主要工作流程、建设过程遇到的问题和解决方案。
大模型在研发数据中台的应用实践
利用大小模型结合的方式,构建多个智能体,提升业务在APP性能追踪定位的效率。
百度搜索的RLHF性能优化实践
本文介绍了搜索从工程视角对大模型RLHF任务的分析与性能优化工作。
Embedding空间中的时序异常检测
在Embedding空间中实现高效的时序异常检测,通过向量化技术捕捉用户行为变化,有效应对复杂业务场景下的异常流量检测。
读友好的缓存淘汰算法
本文探讨了引入缓存解决高访盘吞吐的长尾。
微服务架构革新:百度Jarvis2.0与云原生技术的力量
百度Jarvis2.0,十年磨一剑,以云原生微服务托管平台引领广告业务系统架构革新,实现微服务治理与DevOps的高效融合。
如何定量分析 Llama 3,大模型系统工程师视角的 Transformer 架构
主要从工程师的视角来剖析 Transformer 的整体架构,主要分 4 个部分:
- 第 1 部分会介绍一些基础知识,帮助大家对后面讨论的内容做个铺垫。
- 第 2 部分是对 Transformer 架构的定量分析,也是今天分享的重点。在这个部分我会把 Transformer 架构打开,告诉大家它内部做了什么事情,并针对该模型做了一些定量分析,进而形成一些量化的结论。
- 第 3 部分我们会展示一些目前比较热门的 Transformer 架构变种,并从架构的视角来分析各个变种的效果和优化点。
- 第 4 部分是对一些实际案例进行分析,通过实战更好地让大家对大模型的性能和相关问题有更深入的理解。
财务记账系统中高频热点账户的研究
本文在结算系统升级到了2.0,搭建了一个基于账户余额的财务系统的基础上,讨论了财务系统中较为常见的高频热点账户的现象,研究并给出了一些解决方案,并对不同的解决方案进行对比,给出不同业务场景下适用的解决方案。
百度智能云将大模型引入网络故障定位的智能运维实践
物理网络中,某个设备发生故障,可能会引起一系列指标异常的告警。如何在短时间内从这些告警信息中找到真正的故障原因,犹如大海捞针,对于运维团队是一件很有挑战的事情。
在长期的物理网络运维工作建设中,百度智能云通过各种平台数据的综合分析实现了快速故障定位。近期,更是将大模型成功引入物理网络的故障定位中。相比过去传统的定位分析方法,大模型给网络故障定位的能力建设带来了很多改变。
百度Feed稳定性架构实践
面对数十亿的在线请求流量,如何保证系统的高可用?
百度推荐排序技术的思考与实践
本文主要介绍了百度在推荐排序方面的思考与实践,以及特征、算法和架构三个角度的介绍。百度采用了离散化特征设计,平衡了记忆和泛化效果,特别是对头部用户和稀疏长尾的处理方式不同。文章强调了用户的点击和消费决策序列在模型设计中的重要性。百度通过分层设计和联训提高模型效率,采用弹性计算法保证模型复杂性和性能。精排模型精度高,重排模型在此基础上做list wise。百度希望通过这些措施实现推荐公平和数据分布的平衡。
基于 Native 技术加速 Spark 计算引擎
本文介绍了如何通过将Spark的计算模式改为按列计算,并使用C++语言重写逻辑,来提升Spark计算引擎的性能。文章详细讨论了重写Spark SQL内核的工作量和Databricks已实现的闭源C++版本SQL内核。同时,也提出了可以选择一个性能强大的开源引擎,并改造为符合要求的SQL内核,以减少人力成本。最后,文章展示了将ClickHouse作为Spark SQL的示意图。通过改造Spark引擎并利用ClickHouse的优势,可以显著提高性能。
百度&YY设计稿转代码的探索与实践
Figma & AI相结合生成开发代码的一站式解决方案。
如何实现埋点日志精准监控
基于日志中台实时架构实现准确、可扩展、低成本的日志埋点监控。
从打点平台谈打点治理
本文从打点平台角度,描述日志中台在打点治理方面提供的解决方案与实践经验。