知鸦日报2026-01-12

2026-01-11 16:30:00 ~ 2026-01-12 16:30:00

テクノロジー

DeepSeek新论文:所有人都觉得没必要改的东西,他们改了

摘要

DeepSeek新论文mHC革新了十年未变的残差连接设计。传统残差连接信号固定1:1传递,其改进版HC虽提升性能但导致训练崩溃。mHC创新性地引入双随机矩阵约束,既保留可学习特性又确保信号稳定,在27B模型上将信号波动峰值从3000倍降至1.6倍,推理任务性能提升2%以上,仅增加6.7%训练耗时。这证明基础架构仍有优化空间,同等算力下能榨取更高性能。

登录后可查看文章图片

携程技术:1端开发6端复用:去哪儿RN转QTaro实战经验分享

摘要

去哪儿旅行火车票团队启动“统一前端技术栈”项目,通过React Native代码在多端复用,降低开发与维护成本。项目依托QTaro框架,实现RN到多端的高效转换,解决组件属性、业务逻辑和性能优化等差异问题。通过RN多端库和NativeModules封装,确保各端功能一致,提升用户体验与开发效率。

登录后可查看文章图片

阿里巴巴技术:CodeGenius Memory:构建面向代码生成的可控上下文系统

摘要

阿里升级了CodeGenius的Memory系统,以应对AI Agent在复杂任务中上下文膨胀的挑战。通过结构化、压缩与抽象机制,系统更高效地管理上下文,减少冗余信息,提升模型推理连贯性。新设计包括卸载过时信息、文件去重、动态摘要生成等,显著降低Token消耗,提高缓存命中率,使Agent在长流程任务中表现更稳定。未来将进一步优化上下文隔离与动态策略,推动Agent向更智能协作伙伴演进。

登录后可查看文章图片


‹ 2026-01-11 日报 2026-01-13 日报 ›

qrcode

关注公众号
接收推送