知鸦日报2025-01-10

2025-01-09 16:30:00 ~ 2025-01-10 16:30:00

技术

在 IDE 中实现自然语言搜索代码:RAG 策略的设计与落地

摘要

最近,我们为 AutoDev 的 VSCode 版本中重新引入了先前设计的自然语言搜索代码功能。

在 IDE 中实现自然语言搜索代码:RAG 策略的设计与落地

滴滴技术:聊一下,技术债务治理

摘要

出来混,迟早要还的!几乎所有的技术团队,都会经历或多或少的技术债务问题,滴滴国际化技术团队,通过梳理整体架构,盘点业务挑战,针对性的输出治理方案。

聊一下,技术债务治理

京东技术:「数据密集型应用系统设计」读后感与团队高并发高性能实践案例

摘要

分布式数据系统面临一致性、可用性、分区容错性等挑战,主从复制通过读写分离和数据容灾提高可靠性,MySQL和Redis的主从复制机制各有特点。分区算法包括取模、Hash和一致性Hash,Redis集群通过槽位定位提高扩展性。大Key和热Key带来性能问题,通过重构和优化解决。扩容策略、分库分表、缓存治理是提升系统性能和可靠性的关键。

「数据密集型应用系统设计」读后感与团队高并发高性能实践案例

腾讯技术:腾讯搜索广告:基于混元大模型的生成式召回探索与应用

摘要

大语言模型(Large Language Model,LLM)具有完备的世界知识,通过有监督指令微调和人类反馈强化学习的加持,自然语言精准理解和推断能力得到极大加强,使得模型具备零样本交互能力。搜索广告投放方式和引擎链路依托于自然语言构建,可以借助大模型强大的生成能力进行改造,在不损失用户体验的前提下,极大的提高系统变现能力的天花板。

腾讯搜索广告:基于混元大模型的生成式召回探索与应用

58同城技术:聊聊Druid连接池的内部原理及推荐配置

摘要

详解Druid连接池的内部原理及推荐配置。

聊聊Druid连接池的内部原理及推荐配置

360技术:小样本分类的精准利刃 - 支持向量机(SVM)

摘要

在机器学习领域,数据量对算法性能影响重大。支持向量机(SVM)在小样本分类上表现亮眼,它依据结构风险最小化原则,平衡模型复杂程度与拟合精准度,防止小样本带来的过拟合问题。同时,SVM 重点关注决定分类结果的关键支持向量,以此扩大类别间隔,精准提炼小样本的关键特征,凭借这些优势,在图像识别、生物医疗等诸多领域都发挥了出色作用。

小样本分类的精准利刃 - 支持向量机(SVM)

360技术:大模型微调浅析

摘要

随着transformer技术的快速发展,大模型在自然语言处理领域取得了显著成果。然而,这些通用模型在面对特定任务时,往往需要进行进一步的调整和优化。大模型微调(Fine-tuning)作为一种关键的技术手段,能够有效提升模型在特定任务上的表现。本文将从基本概念、常见方法、技术细节、实践案例以及未来挑战等方面,对大模型微调进行介绍。

大模型微调浅析

Understanding The “Why”: 10 Techniques for Causal Inference

摘要

With the right tools you can get some pretty deep insights.

Understanding The “Why”: 10 Techniques for Causal Inference

‹ 2025-01-09 日报 2025-01-11 日报 ›