2025-02-17 16:30:00 ~ 2025-02-18 16:30:00
企业在58平台招聘时,认证流程复杂导致用户流失。通过调研发现,用户在决策、信息理解和操作上成本高。于是,我们从信息语义、页面结构和认证步骤三方面简化流程:优化认证选择、缩减用户教育内容、提升上传材料效率、改进结果反馈方式。最终,认证提交率和成功率显著提升,用户体验大幅改善。
B站通过算法优化流媒体业务,提升用户体验。点播业务中,利用XGBoost模型预测“头部稿件”,优化转码决策,节省存储和带宽。资源量化模型动态调整转码任务,提升资源利用率。转码耗时预估模型采用xdeepfm,误差小于5分钟。直播弹幕语义分析通过SBERT模型实时识别用户反馈,提升直播质量。各项算法赋能显著提升业务效率和用户满意度。
随着企业业务拓展,API成为攻击者的主要目标,风险敞口扩大。通过流量分析,API异常检测实践聚焦于资产盘点、能力建设和风险防范。方案包括整体框架、事件响应SOP、实践流程,涵盖场景挖掘、特征工程、阈值画像和日常运营。检测手段结合日志分析、用户行为建模和大数据分析,策略分为规则型、模型检测和基线策略,有效应对爬虫、欺诈和中高频访问等异常流量。
京东广告团队基于大语言模型技术,开发了京准通智能助手,应用于广告投放场景。通过RAG和Function Call两大核心技术,智能助手实现了智能客服、数据查询、广告创编等功能。团队还构建了Agent搭建平台,提升工程复用率和应用搭建效率,支持多Agent架构升级,持续优化商家服务体验。
本文分享了作者在2024年初接手内容风控团队稳定性工作后的经验总结,探讨了系统稳定性的定义、面临的挑战及解决方案。通过事前降发生、事中降影响、事后优改进的三步策略,成功提升了系统稳定性,实现了上游请求成功率和应急时效的显著提升,解决了卡单问题,并完成了单元化架构的升级。
rsync通过增量传输算法实现高效文件同步,核心在于文件级和数据块级的增量传输。发送端计算校验码,接收端根据校验码重组文件,实现同步。rsync适用于大量小文件的实时同步,但对频繁更改的大文件如数据库,更适合用于备份而非实时同步。合理配置工具可提升实时同步效率。
生成式推荐大模型在京东联盟广告业务中优化UCTR与UCVR指标,通过DPO对齐范式实现多目标优化。商品离散化和行为序列建模简化了推荐流程,提升了模型泛化能力。Softmax-DPO和β-DPO方法分别处理多负例和参数敏感问题,线上实验显示转化率显著提升。未来探索方向包括多目标优化和多场景建模。
Qunar酒店搜索排序模型从LambdaMart升级到LambdaDNN,通过深度学习提升泛化能力。多目标模型MMOE引入CTR和CTCVR任务,缓解样本偏差,提升点击率。多场景融合优化中,特征分类建模增强场景差异学习,提升转化率。特征选择采用变分dropout,剔除冗余特征,提升模型效果。整体演进验证了深度模型在搜索排序中的有效性。
本文探讨了优化本地部署大模型性能的方法,重点介绍了提升吞吐量和响应时间的关键技术。通过CPU与GPU分离设计、Paged Attention解决显存碎片、Radix Attention减少重复计算、Chunked Prefill避免请求卡顿、多卡推理加速、预测解码等技术,显著提高了大模型推理效率。最后分享了Deepseek-R1模型的高效部署步骤。
百度网盘在应对高并发场景下的系统雪崩问题中,设计了一套防雪崩机制。通过动态熔断和流量隔离减少过载流量,结合请求有效性和socket有效性判断,避免处理无效请求。该机制有效防止了系统崩溃,保障了业务的可用性,提升了用户体验。这套架构为复杂链路下的高并发场景提供了可靠的解决方案。
在AI大模型应用中,Prompt是引导模型解决实际问题的关键。通过明确指令、上下文、输入数据和输出指示,Prompt能精准调用模型能力。RTF、RISEN等框架帮助优化Prompt设计,提升模型在客服、推理等场景的表现。少样本提示、思维链提示等技术进一步增强模型理解与推理能力,确保输出准确可靠。掌握Prompt撰写原则,如明确指令和充足思考时间,能显著提升大模型的业务价值。
关注公众号
接收推送