话题公司 › 百度

公司:百度

0 Token 间间隔 100% GPU 利用率,百度百舸 AIAK 大模型推理引擎极限优化 TPS

大模型推理引擎是生成式语言模型运转的发动机,是接受客户输入 prompt 和生成返回 response 的枢纽,也是拉起异构硬件,将物理电能转换为人类知识的变形金刚。

大模型推理引擎的基本工作模式可以概括为,接收包括输入 prompt 和采样参数的并发请求,分词并且组装成 batch 输入给引擎,调度 GPU 执行前向推理,处理计算结果并转为词元返回给用户。

百度视频搜索架构演进

以大模型技术为主线,打造高性能,扩展灵活的视频搜索排序框架,同时完成存量排序系统的熵减治理,从而来大幅度提升排序系统的系统能力,降级系统长期运营治理成本。

网页结构建模在低质采集站上的识别应用

利用 MarkupLM 中将网页结构和文本特征相结合的建模方法,识别挖掘搜索内容反作弊场景下的恶劣采集站点。

海量存储的批量计算框架

本文介绍了百度内容存储团队针对海量存储数据计算需求研发的HTAP表格存储系统及计算调度架构。

网页多模态建模思考

本文从多模态信息融合,预训练任务构建角度,探讨通用网页建模方案。

百度垂搜一站式研发平台演进实践

百度垂搜一站式研发平台FaaS机制和SaaS服务产品化的演进实践。

广告投放系统成本降低 70%+,基于 Redis 容量型数据库 PegaDB 的方案设计和业务实践

在传统的计算广告业务流程中,广告的展示需要涉及多个参与方,包括用户、广告主、媒体平台、广告交易平台(ADX),以及需求方平台(DSP)等。并且,这一过程通常需要经历十几次的交互才能最终完成广告的展示。

初探图谱Embedding用于异常检测(一)

本文介绍了一种基于One-Hot编码的图谱Embedding算法GEE,并在些基础上进行了改进和验证,为实现对团伙行为的异常检测提供了基础。

AIAPI - 转向AI原生检索

AIAPI、RAG、AGI、数据结构化、系统优化。

AI Agent重塑微服务治理

AI Agent重构微服务治理解决运维复杂性难题。

基于GPU的ANN检索

与NVIDIA技术团队合作,设计并实现了一种基于GPU的ANN在线检索方案,在实际高检索流量业务场景下获得了显著的成本收益。

维度爆炸背景下uv计算在Feed业务的高效实践

从Feed实际业务出发,优化大数据计算中多维度用户数统计,通过数据打标的方式避免数据膨胀,提高性能并减少计算成本。

精准触达,定制盛宴:细分用户下的玩法与视觉运营策略

本文以百度APP任务系统长线活动为例,阐述如何通过精细化用户细分,结合创新的玩法设计与视觉呈现,打造一场运营盛宴。

ClickHouse在百度MEG数据中台的落地和优化

在百度MEG数据中台构建的图灵3.0生态以及OneData+开发范式中,TDE-ClickHouse作为重要的基础引擎之一,我们主要从查询性能、数据导入和分布式架构三个方面对其进行了相应优化。

用增结算数仓化改造:在/离线调度系统的构建与应用

从业务角度出发的平台架构变革。

百度优选—黄金购买链路体验升级

设计针对百度APP场域多、流量类型复杂的特殊情况,推进黄金购买链路框架、流程、页面全线升级。

- 위키
Copyright © 2011-2025 iteam. Current version is 2.139.1. UTC+08:00, 2025-01-16 13:13
浙ICP备14020137号-1 $방문자$