知鸦日报2026-01-14

2026-01-13 16:30:00 ~ 2026-01-14 16:30:00

技术

京东技术:从零开始的大模型之旅|解码大模型:开篇&技术篇1.1—基础架构概念

摘要

探索大模型技术之旅:从Transformer架构到预训练微调,再到参数规模与模型能力的关系,揭示了现代AI的核心原理。涌现能力的突现性、不可预测性和临界性,展示了AI系统的复杂动力学。MoE架构通过稀疏激活实现效率与性能的平衡,稀疏模型则代表了未来超大规模模型的发展方向。这些技术共同推动了大模型的广泛应用与创新。

登录后可查看文章图片

京东技术:Kafka、RocketMQ、JMQ 存储架构深度对比

摘要

消息队列存储架构是关键,Kafka、RocketMQ、JMQ各具特色。Kafka以Topic-Partition为核心,依赖顺序I/O和mmap实现高吞吐。RocketMQ采用CommitLog+ConsumeQueue+IndexFile三层结构,分离数据存储与索引查询。JMQ结合两者优点,以PartitionGroup为基本单元,优化写入和读取性能,适合高并发场景。

登录后可查看文章图片

腾讯技术:微信文本嵌入模型KaLM-Embedding登顶全球榜单:数据工程与训练技巧详解

摘要

微信团队开源KaLM-Embedding系列模型,包括中英双语的轻量版V2系列和登顶MTEB多语言榜首的Gemma3-12B-2511。该模型通过双向注意力机制、焦点式重加权等创新技术,显著提升语义检索精准度,支持RAG架构及搜索推荐等场景。开源工具链涵盖数据配方、训练管线及商业授权,实测在客服FAQ等工业场景表现优异,低参数量下性能媲美大模型。技术报告和模型已公开。

登录后可查看文章图片


‹ 2026-01-13 日报 2026-01-15 日报 ›

qrcode

关注公众号
接收推送