知鸦日报2025-11-14

2025-11-13 16:30:00 ~ 2025-11-14 16:30:00

技术

LLM可观测技术初探

摘要

大语言模型(LLM)可观测技术通过数据采集、语义建模和行为分析,解决LLM“黑盒”问题,提升模型可靠性、安全性和成本可控性。其核心架构涵盖采集、存储、模型和应用四层,支持端到端追踪、效能分析和资源监控。评估标准主观性、性能开销和隐私合规是主要挑战,需通过定制评估、智能采样和差分隐私等手段应对,助力企业构建可信AI生态。

登录后可查看文章图片

阿里巴巴技术:打通出行最后一公里|高德面向地铁场景的多模态智能图文引导系统

摘要

高德地图推出地铁站内多模态智能图文引导系统,填补“最后一公里”导航空白。该系统通过VR、图文和文字提示等多种方式,为用户提供无缝的端到端出行体验。技术方案包括数据采集、自动化审核、图文生产等环节,结合语音、视觉和多模态大模型,确保引导信息的精准性和清晰度。项目已全面覆盖地铁站内进站、出站、换乘场景,用户反馈积极。

登录后可查看文章图片

搜狐技术:MediaPipe Tasks 在 Android 中的生成式 AI 实践:基于 Gemma 3n 的移动端

摘要

Google 的 MediaPipe 框架为移动端 AI 应用提供了强大支持,特别是最新的 Gemma 3n 模型,通过 PLE 参数缓存MatFormer 架构 优化了移动设备的计算和内存效率。MediaPipe 提供了丰富的工具集,如 Model MakerStudio,支持多模态任务和设备端推理。开发者可以通过动态参数调优和 LoRA 技术,在不同设备上高效运行生成式 AI 任务,确保隐私保护和实时响应。

RL Environments and the Hierarchy of Agentic Capabilities

摘要

2025年,AI从聊天框走向现实世界,但离通用智能仍有距离。RL环境成为模型训练的核心,模拟真实任务提升多步操作能力。GPT-5和Claude Sonnet 4.5表现领先,但仍失败率超40%。模型需掌握工具使用、目标形成、计划执行等基础技能,逐步提升适应性、现实锚定和常识推理能力。当前模型在复杂任务中仍显不足,通用智能的实现仍需时间与突破。

登录后可查看文章图片

阿里巴巴技术:淘宝搜索算法:推理型相关性LLM探索实践

摘要

电商搜索中,Query与商品相关性判别技术至关重要,直接影响用户体验和商家效率。传统BERT模型虽能处理大部分搜索需求,但在长尾复杂query上表现不足。本文提出基于大模型的优化框架,通过CoT微调、Pass@N-based DPO和动态采样GRPO,显著提升模型推理能力,解决了在线部署和错误累积问题,最终在难query评测集上取得显著效果。

登录后可查看文章图片

三七互娱技术:dify-vdb 向量数据库迁移实战笔记

摘要

Dify团队将知识库从Weaviate向量数据库迁移至某云AnalyticDB(ADB),以提升性能、扩展性和降低运维成本。迁移过程包括环境克隆、数据分批迁移、多环境切换及数据一致性校验。通过分阶段推进、增加重试机制和分段处理,解决了迁移中的超时、召回条目数超预期等问题。此次迁移标志着AI向量数据库正逐步融入主流数据库,未来结构化、半结构化与语义数据将共享同一底座。

登录后可查看文章图片

汽车之家技术:从拟物到 Liquid Glass:苹果设计语言变革与未来信息呈现探索

摘要

苹果最新设计语言 Liquid Glass 带来视觉革新,模拟玻璃质感与光影效果,提升用户体验。从拟物化到扁平化,再到 Liquid Glass,苹果设计语言不断进化,响应多元化信息呈现趋势。未来,二维与三维结合的交互方式将更加沉浸,技术革新将推动信息展示迈向新高度,数字世界将更加真实与自然。

登录后可查看文章图片

360技术:Agent skills:AI 能力扩展的新范式

摘要

Agent Skills让AI能力扩展平民化,用户无需编程即可定制AI功能。通过模块化设计,Claude能自动调用Skills处理文档、数据等任务,提升效率并确保准确性。与MCP相比,Skills更简单安全,适合标准化任务。官方提供预建Skills,支持自定义,未来AI定制时代已来,人类将更专注于创造与决策。

登录后可查看文章图片


‹ 2025-11-13 日报 2025-11-15 日报 ›

qrcode

关注公众号
接收推送