知鸦日报2025-11-04

2025-11-03 16:30:00 ~ 2025-11-04 16:30:00

Công nghệ

CPU Cache-Friendly Data Structures in Go: 10x Speed with Same Algorithm

摘要

缓存命中率对代码性能至关重要,L1缓存命中比RAM快60倍。虚假共享问题在多核CPU中尤为突出,不同核心更新同一缓存行的变量会导致性能大幅下降。通过数据填充和结构优化,性能可提升5-10倍。数据导向设计在高性能系统中优于面向对象设计,预取和分支预测优化也能显著提升性能。缓存友好代码不仅是优化,更是现代CPU架构下的必要手段。

腾讯技术:十分钟速通大模型原理!从函数到神经网络

摘要

大模型的核心在于神经网络,通过函数拟合数据规律,逐步从线性到非线性扩展。激活函数和多层神经网络让模型更复杂,梯度下降和反向传播优化参数。正则化和Dropout防止过拟合。矩阵运算提升计算效率,词嵌入捕捉词语关系。RNN处理序列数据,Transformer通过注意力机制实现全局理解,多头注意力增强模型表现。大模型基于Transformer解码器,预测下一个词,广泛应用于对话、写作等场景。

当幽默遇上数学:用最不搞笑的方式研究如何搞笑

摘要

用微积分算笑点?看似荒诞,实则科学。本文通过数学模型,解构幽默的奥秘。意外性、关联性、时机、氛围四要素相乘,决定笑果大小。段子密度、铺垫时长、笑声传播都有最优值。自嘲式幽默最安全,犀利观察风险大但效果好。公式虽能指导,但灵感火花不可替代。幽默,终究是一门艺术。

阿里巴巴技术:Midscene.js 实战与源码剖析:如何重塑 UI 自动化

摘要

Midscene.js是一款基于AI的下一代UI自动化工具,旨在解决传统UI自动化工具在元素选择器脆弱性、维护成本高、调试体验差和跨平台支持不足等问题。它利用视觉语言模型(VL模型)和多模态LLM模型,实现智能元素识别和自动化操作,提升测试和操作的效率与准确性。工具支持Chrome插件试用,通过自然语言描述操作意图,简化复杂场景的处理,适用于多种业务场景,如智能营销和智能发品。

融合多模态大模型的视频分析技术探索与实践

摘要

多模态大模型突破传统视频分析局限,融合视觉、音频、文本实现跨模态推理,准确率提升显著!通过思维链优化和GRPO策略增强时序理解,在行为检测、智能监控等场景表现亮眼。边缘部署验证可行性,动态分析任务准确率比传统CNN高10-15%。未来将向具身智能和开放世界演进,打造新一代视频语义理解基础设施。

grab技术:How We Built a Custom Vision LLM to Improve Document Processing at Grab

摘要

东南亚语言和文档格式多样,传统OCR系统在处理时面临挑战。为解决这一问题,我们开发了轻量级专用视觉LLM。通过合成OCR数据集和内部平台Documint生成高质量训练数据,采用两阶段训练方法,显著提升了OCR和关键信息提取的准确性。最终,我们构建了1B参数的定制模型,在保持高性能的同时降低了延迟,验证了小型专用模型的有效性。

登录后可查看文章图片

The Evolution from RAG to Agentic RAG to Agent Memory

摘要

AI智能体的记忆机制从基础的RAG逐步演化为代理式RAG,最终引入记忆管理概念。RAG通过外部知识源增强LLM的上下文,代理式RAG则让智能体动态决定是否检索及选择工具,而记忆机制进一步允许智能体读写信息,实现个性化交互。记忆管理涉及多种类型记忆源,并需应对记忆损坏和遗忘策略等新挑战。

G行应用韧性体系建设 ——全链路灰度发布技术应用

摘要

G行通过全链路灰度发布技术,解耦部署与发布流程,降低投产风险。该技术采用流量染色、策略管控、服务路由三位一体架构,实现资源与流量的双重隔离,确保灰度流量仅在灰度链路流转。通过标准化流程、立体化监控和敏捷化应急,G行构建了全场景、全周期的运维治理闭环,有效保障了业务连续性和系统稳定性。

七猫技术:AIOps 通用 Agent 探索(Simple)

摘要

本文探讨了基于ReAct框架开发AIOps通用Agent,旨在通过Prompt+LLM+Tools+Workspace的方式实现DevOps流程自动化。该Agent简化了Manus架构,支持用户通过提示词定义流程,快速集成AI能力。核心组件包括管理平台、Agent引擎和执行环境,采用Docker隔离运行环境,确保可靠性。实践表明,AIOps通用Agent在代码评审报告中表现优异,未来计划搭建管理平台,进一步提升功能和架构。

登录后可查看文章图片

不再搞Chain 设计的LangChain 1.0,与LangGraph有哪些区别?

摘要

LangChain 1.0 通过放弃 Chain 设计,引入标准化 ReAct 循环和 Middleware 机制,简化了 Agent 开发流程。新版本支持生产级控制,解决了上下文溢出、敏感信息泄露等问题,并统一了模型接入标准。结合 Milvus 向量数据库,LangChain 提供了高效的记忆系统,增强了 Agent 的长期记忆能力,使其更适用于复杂场景。

得物技术:大模型如何革新搜索相关性?智能升级让搜索更“懂你”

摘要

得物利用大模型技术优化搜索相关性,解决传统BERT模型标注成本高、迭代慢、泛化差的问题。通过二阶段流程和R1慢思考机制,大模型准确率提升至86.67%,中长尾场景表现显著改善。线上测试显示,badcase率下降5.39%,节约百万级标注成本。未来将探索生成式排序和logits蒸馏,持续提升搜索精准度。


‹ 2025-11-03 日报 2025-11-05 日报 ›

qrcode

关注公众号
接收推送