知鸦日报2026-06-27

2026-06-26 16:30:00 ~ 2026-06-27 16:30:00

Technology

腾讯混元AI Infra如何优化Hy3 Preview:一次大模型推理性能提升的技术拆解

摘要

Hy3 preview模型在Hopper卡上实现了极致推理性能优化。通过动态调度Attention、双BF16重构Router GEMM、FusedMoE流水线重构等算子优化,以及多级缓存、MTP异步调度、量化稀疏等技术,在有限硬件下显著降低延迟、提升吞吐,解决了长上下文推理瓶颈。

登录后可查看文章图片

京东健康OPC团队的产品全流程Skill探索

摘要

京东健康OPC团队引入Anthropic的8个产品管理Skill,形成“问题判断→需求定义→排期执行→上线复盘”四阶段流程。它帮助无专职产品的团队,把每个需求走通证据、假设、边界、排期、验收、复盘六个环节,确保产品决策清晰可追溯。

登录后可查看文章图片

QoderWork Skills 开发实践:从传统数科到 AI 数科的转型探索-我的Skills进阶之旅

摘要

将领域知识、标准流程封装为AI可执行的“数字助手”Skill。核心是四层分离架构:编排层、参数层、实现层、知识层。通过结构化指令提升分析效率,实现团队知识标准化,解放人力聚焦高价值决策。

登录后可查看文章图片


‹ 2026-06-26 日报 2026-06-28 日报 ›

qrcode

关注公众号
接收推送