话题公司 › 百度

公司:百度

百度慧播星数字人技术演进

百度慧播星作为全链路AI直播平台,通过检索增强和强化学习生成高转化脚本,利用智能中控优化直播策略,实现语音与形象克隆的“小时级”效率。平台覆盖电商、教育等多行业,日均服务2万+直播间,罗永浩数字人直播GMV突破5500万。未来,慧播星将持续迭代,提升智能化与拟真度,优化直播体验。

突破显存瓶颈:基于 DeepSeek-V3.2-Exp 的 Latent Cache 卸载预取方案设计与模拟验证

DeepSeek-V3.2-Exp在长上下文推理中面临显存限制,导致Decode阶段吞吐受限。百度百舸AIAK团队提出ESS方案,通过将Latent Cache卸载至CPU内存,结合Offload-Prefetch机制,显著提升吞吐并降低成本。ESS兼容现有优化策略,通过高效数据传输和缓存管理,突破显存瓶颈,尤其在超长上下文场景下表现优异,为大规模模型推理提供高效解决方案。

基于AI的质量风险管控

百度移动生态团队构建了一套智能化质量风险管控系统(RMCS),通过AI技术实现风险前置拦截、实时感知与快速止损。系统包含三大核心模块:风险管理系统(RMS)动态识别质量漏洞,风险感知系统(ROS)智能降噪报警,风险控制系统(RCS)自动化定位止损。实践显示,线上问题总量三年降低53%,AI值班人协助率达96%,形成人机协同的高效质量防御体系。

破局复杂业务场景:百度数据分析平台(TDA)分析增强与性能优化的双轮驱动

TDA平台通过增强复杂统计指标自动计算能力、优化性能,满足业务深度分析需求。平台支持周报/月报自动生成,提升工作效率。同时,引入归因决策工具,帮助业务快速定位数据异常。性能优化方面,通过缓存、多级聚合及并发查询,显著提升查询速度,确保用户分析体验。AI融合将进一步推动平台智能化,释放数据价值。

百度大数据成本治理实践

百度MEG大数据团队通过构建统一治理标准与智能平台,实现计算与存储资源的全生命周期管理。计算侧采用混合调度与智能调参技术,优化千万核资源使用率30%+;存储侧通过智能压缩与冷热分层,提升存储效率20%+。年化节省成本达数千万元,为业务高速发展提供可持续的降本增效方案。

大模型在百度电商机审应用的落地实践

百度电商风控团队利用大模型技术重构机审体系,解决了传统机审流程中的多模态识别弱、语义模糊、审核体验差等痛点。通过“多模态大模型+规则+知识库”协同的机审Agent方案,实现了全机审覆盖、即时反馈和高可解释性,显著提升了平台安全性、商家效率和用户信任度。这一技术方案为电商风控领域提供了可迁移的标杆式实践。

大规模微服务系统中的雪崩故障防治

大规模微服务系统中,雪崩故障因其破坏力大、难以预防而成为系统性威胁。雪崩从非稳态到自强化崩溃,涉及重试风暴、容量退化等正反馈回路。通过重试预算、队列限流、全局TTL控制等自愈机制,以及秒级流量调度与降级预案,有效预防和治理雪崩,确保系统稳定运行。

数据平台数据智能化入库

数据平台智能化入库方案通过大型语言模型(LLM)构建“智能代码闭环”,实现数据Schema识别、结构化映射、质量规则抽取到入库包构建的全流程自动化。该方案大幅缩短接入周期至3天内,降低人工成本至零干预,提升系统可控性与扩展性,为企业数据治理与智能化运营奠定技术基础。

百度APP日志处理框架升级之路

百度APP数据仓库完成系统性升级,通过"两步走"策略解决资源压力与架构瓶颈。第一阶段优化日志清洗环节,实现刻钟级调度与存储成本降低;第二阶段解耦实时离线链路,提升计算框架容错能力。升级后数据处理时效性提升50%,存储成本节省超420TB/天,为业务发展提供更高效稳定的数据支撑。

百度电商MultiAgent视频生成系统

AIGC技术正革新视频创作,尤其在电商领域,通过MultiAgent协同系统提升视频生成效率。早期项目依赖规则,导致视频同质化严重,新版迭代引入多类型素材和动态调度,显著增强吸引力。分镜脚本生成Agent优化脚本准确率和吸引力,素材生成则通过泛图表和优选提升质量。未来方向聚焦端到端剧本生成和AIGC生成式视频,解决供给不足和可用率问题。

百度Feed实时数仓架构升级

Feed实时数仓在业务高速发展中面临计算成本高、时效慢、指标对不齐等问题。通过重构,流批一体升级为纯流式架构,离线复杂业务逻辑下沉实时计算,统一指标出口,解决了下游业务指标不一致问题。重构后,计算成本降低50%,数据产出时效提升80%,查询效率提升90%,服务稳定性大幅提升。未来计划优化计算引擎,提升开发效率,建设厂内实时数仓标杆。

大模型评测实践与思考

2023年是大模型元年,但真正被记住的模型不多。2024年技术与应用驱动下,大模型发布数量激增,2025年DeepSeek爆火,模型竞争白热化。面对众多SOTA模型,企业和开发者如何选型成难题。评测方法、数据集和指标的选择至关重要,需结合业务实践进行综合评估,避免盲目追逐最新模型。

播放器视频后处理实践(一)

视频后处理技术正成为提升播放体验的关键。本文重点解析亮度与色彩增强两大核心方案:亮度增强采用Gamma变换,避免过曝并模拟显示设备响应曲线;色彩增强基于HSV空间调节饱和度,结合自适应算法与肤色保护,确保自然观感。两项技术已在移动端落地,显著提升画质表现。未来将探索场景化优化与实时性提升,持续完善视频处理链路。

AI在实际生成环境中的提效实践

本文探讨了如何利用AI提升研发效率,通过整合AI工具和工作流,实现从需求分析到运维的全流程自动化。重点介绍了AI在需求文档生成、代码编写、接口管理、代码审查和运维告警处理中的应用,强调AI应取代重复性工作,让开发者聚焦核心业务。通过合理使用AI IDE规则和记忆库,团队能够显著提高开发效率和代码质量。

搜索数据建设系列之数据架构重构

百度搜索业务通过宽表模型设计、计算引擎优化和图灵3.0开发模式,解决了传统数仓在快速迭代场景下的性能与成本问题。采用Parquet列式存储和Spark引擎提升查询效率,结合Iceberg实现高效回溯。新模式下数据集建设让业务自助分析占比提升至90%,查询性能达秒级,人力成本降低66%。未来将探索AI大模型与通用数据流技术,持续优化数据架构。

百度日志中台前端重构实践

日志中台前端项目因技术债务和代码臃肿问题,进行了全面重构。通过引入工程化工具、升级技术栈、优化构建部署流程,提升了开发效率和代码质量。重构后,项目采用Vite构建工具,部署时间大幅缩短,并引入了组件库和通用工具库,进一步提高了开发体验和代码复用率。

首页 - Wiki
Copyright © 2011-2025 iteam. Current version is 2.148.2. UTC+08:00, 2025-12-12 06:09
浙ICP备14020137号-1 $访客地图$