知鸦日报2026-04-29

2026-04-28 16:30:00 ~ 2026-04-29 16:30:00

Technology

面向电商直播场景的全模态大模型推理加速方案

摘要

这篇干货分享了大模型TLiveOmni在电商直播场景的实战部署秘籍!通过vLLM框架深度适配,修复多模态Token排布和浮点运算问题,结合SmoothQuant+GPTQ复合量化方案,在H20和RTX 4090上实现2.5-3.5倍加速,精度损失仅1.5%。更提炼出FP8(H20)和W4A16(4090)的黄金配置策略,为多模态大模型落地提供了硬核技术方案。

登录后可查看文章图片

深度学习应用篇-计算机视觉-目标检测[4]:边界框bounding box、锚框、交并比、非极大值抑制NMS、SoftNMS

摘要

深度学习在计算机视觉中的目标检测技术大揭秘!从边界框、锚框到交并比和非极大值抑制NMS,一文带你掌握核心概念。目标检测不仅能识别物体类别,还能精确定位位置,广泛应用于人脸解锁、自动驾驶等场景。文章还对比了两阶段和单阶段检测算法,并介绍了经典数据集和最新技术进展,干货满满!

登录后可查看文章图片

airbnb技术:Skipper: Building Airbnb’s embedded workflow engine

摘要

GPU隔离技术的分析与改进

摘要

AI时代GPU利用率低成痛点,B站创新方案破解隔离难题!通过分析NVIDIA的MPS、MIG等方案缺陷,自研内核级隔离技术BGM,从驱动层动态调控时间片和显存分配。实测显示,混部业务吞吐比精准匹配算力配置,高优任务延迟降低50%。开源驱动赋能下,硬核技术让GPU资源像乐高般灵活切分,混部性能杠杠的~(138字)

登录后可查看文章图片

AI手工测试用例的实践进阶之路

摘要

传统手工测试用例面临信息碎片化、时间窗口压缩、个人经验依赖等问题。AI用例生成项目通过MVP验证方向,1.0阶段补齐输入解析、Prompt工程化等关键能力,最终沉淀为测试智能体平台。核心在于升级测试设计链路,实现多源输入协同、过程治理和资产闭环,提升覆盖质量与生成效率,推动测试工程体系智能化演进。

登录后可查看文章图片

深入浅出Harness Engineerring之核心模式与理念

摘要

"Claude智能体架构深度解析:通过持久化指令、分层记忆和沙箱隔离实现高效任务处理。核心采用三件套解耦设计(Claude大脑+Harness控制器+Sandbox沙箱),支持多智能体协作模式。独创五层记忆体系从临时对话到长期知识库逐级沉淀,配合风险分级工具管理,在保证安全性的同时提升60-90%响应速度。智能体具备持续进化能力,通过辩证式用户建模实现越用越懂你的个性化服务。"

登录后可查看文章图片

An open-source spec for Codex orchestration: Symphony

摘要

Harness Engineering实践,做了一个平台让AI一晚上自动评测和优化你的系统

摘要

AI评测平台实现全自动化测试与优化,支持无UI、带UI及系统级评测。AI自主生成评测集、执行测试并提交报告,还能基于结果自动优化系统。案例显示,钉钉文档MCP功能评测得分95分,绘报UI内容质量评测获85分,业务系统经三轮优化后评分从90.7提升至99.1。关键在于系统规范性和AI Coding含量,老系统断头路多则难以实现自动化。

登录后可查看文章图片

用AI一个月做Unreal游戏能做到什么程度?

摘要

【AI+UE开发实战】新手仅用1个月,借助自研Loop-code工具将单机Demo改造成联机游戏!通过封装MCP插件实现IDE智能操控UE蓝图,解决状态同步、物理交互等核心难题。关键点:①工具支持一键部署+便携更新;②AI辅助完成90%代码/蓝图修改;③联机方案采用"后台服务+帧同步"架构。实践证明:AI擅长局部优化,全局设计仍需开发者把控。

登录后可查看文章图片

与AI结对编程,一路同行:一款数据库稳定性保障插件之AI设计开发结对编程实践之路

摘要

突发流量对系统冲击大,数据库面临QPS飙升、慢SQL增多等问题。传统三板斧(KILL、主从切换、重启)效果有限。为此设计了一款MyBatis插件,通过拦截SQL生成指纹,动态匹配配置的阈值并触发三种策略(中断、静默丢弃、延迟执行),结合比例控制流量。从设计到开发,借助JoyCode高效实现,经代码优化和单元测试后投入应用,有效缓解数据库压力。

登录后可查看文章图片

在 RDS PostgreSQL 中实现 RaBitQ 量化

摘要

pgvector扩展让PostgreSQL具备向量检索能力,适用于语义搜索、图像检索等场景。RaBitQ量化技术大幅压缩向量存储空间,提升查询效率,特别是IVF-RaBitQ在大规模数据场景下表现优异。通过SQL语句即可轻松创建RaBitQ索引,实现高效向量检索,无需额外引入专用数据库。

登录后可查看文章图片

AI 时代的 Git 版本管理,你用对了吗?

摘要

Agentic coding时代,Git工作流面临新挑战:Agent自主执行、并发协作导致意图模糊、提交混乱。推荐三大核心实践:隔离(分支保护+worktree)、透明(原子提交+结构化信息)、自动化(CI防护)。工具上可尝试Jujutsu的变更中心模型或GitButler虚拟分支,让版本历史成为可靠知识库。关键在于将规范显式化、工具化,适应AI协同开发新范式。

登录后可查看文章图片

pinterest技术:From Clicks to Conversions: Architecting Shopping Conversion Candidate Generation at Pinterest

摘要

读完这篇,你就搞懂 DeepSeek v4 了

摘要

DeepSeek-V4模型凭借1.6T参数和1M上下文窗口,成为开源最强模型。其创新架构mHC、CSA/HCA优化了残差连接与注意力机制,显著提升长文本处理效率。Muon优化器确保训练稳定,FP4量化降低显存消耗。TileLang加速算子开发,Infra优化提升硬件利用率。V4不仅在评分上接近闭源巨头,更在系统级重构与工程优化上展现了卓越实力。

登录后可查看文章图片

聊聊AI协同开发编写【测试用例】这件事

摘要

AI辅助测试用例平台设计思路:先让AI将需求文档结构化,再拆解功能点形成测试树,最后按需生成用例。平台支持多模型切换、知识库挂载和人工干预,简单需求AI采纳率超90%,复杂需求达50%。核心逻辑是AI处理结构化信息,人工把控业务细节,解放测试人员生产力,实现高效人机协同。

登录后可查看文章图片


‹ 2026-04-28 日报 2026-04-30 日报 ›

qrcode

关注公众号
接收推送