知鸦日报2025-11-14

2025-11-13 16:30:00 ~ 2025-11-14 16:30:00

技术

LLM可观测技术初探

摘要

大语言模型（LLM）可观测技术通过数据采集、语义建模和行为分析，解决LLM“黑盒”问题，提升模型可靠性、安全性和成本可控性。其核心架构涵盖采集、存储、模型和应用四层，支持端到端追踪、效能分析和资源监控。评估标准主观性、性能开销和隐私合规是主要挑战，需通过定制评估、智能采样和差分隐私等手段应对，助力企业构建可信AI生态。

登录后可查看文章图片

阿里巴巴技术：打通出行最后一公里｜高德面向地铁场景的多模态智能图文引导系统

摘要

高德地图推出地铁站内多模态智能图文引导系统，填补“最后一公里”导航空白。该系统通过VR、图文和文字提示等多种方式，为用户提供无缝的端到端出行体验。技术方案包括数据采集、自动化审核、图文生产等环节，结合语音、视觉和多模态大模型，确保引导信息的精准性和清晰度。项目已全面覆盖地铁站内进站、出站、换乘场景，用户反馈积极。

登录后可查看文章图片

搜狐技术：MediaPipe Tasks 在 Android 中的生成式 AI 实践：基于 Gemma 3n 的移动端

摘要

Google 的 MediaPipe 框架为移动端 AI 应用提供了强大支持，特别是最新的 Gemma 3n 模型，通过 PLE 参数缓存 和 MatFormer 架构 优化了移动设备的计算和内存效率。MediaPipe 提供了丰富的工具集，如 Model Maker 和 Studio，支持多模态任务和设备端推理。开发者可以通过动态参数调优和 LoRA 技术，在不同设备上高效运行生成式 AI 任务，确保隐私保护和实时响应。

RL Environments and the Hierarchy of Agentic Capabilities

摘要

2025年，AI从聊天框走向现实世界，但离通用智能仍有距离。RL环境成为模型训练的核心，模拟真实任务提升多步操作能力。GPT-5和Claude Sonnet 4.5表现领先，但仍失败率超40%。模型需掌握工具使用、目标形成、计划执行等基础技能，逐步提升适应性、现实锚定和常识推理能力。当前模型在复杂任务中仍显不足，通用智能的实现仍需时间与突破。

登录后可查看文章图片

阿里巴巴技术：淘宝搜索算法：推理型相关性LLM探索实践

摘要

电商搜索中，Query与商品相关性判别技术至关重要，直接影响用户体验和商家效率。传统BERT模型虽能处理大部分搜索需求，但在长尾复杂query上表现不足。本文提出基于大模型的优化框架，通过CoT微调、Pass@N-based DPO和动态采样GRPO，显著提升模型推理能力，解决了在线部署和错误累积问题，最终在难query评测集上取得显著效果。

登录后可查看文章图片

三七互娱技术：dify-vdb 向量数据库迁移实战笔记

摘要

Dify团队将知识库从Weaviate向量数据库迁移至某云AnalyticDB（ADB），以提升性能、扩展性和降低运维成本。迁移过程包括环境克隆、数据分批迁移、多环境切换及数据一致性校验。通过分阶段推进、增加重试机制和分段处理，解决了迁移中的超时、召回条目数超预期等问题。此次迁移标志着AI向量数据库正逐步融入主流数据库，未来结构化、半结构化与语义数据将共享同一底座。

登录后可查看文章图片

汽车之家技术：从拟物到 Liquid Glass：苹果设计语言变革与未来信息呈现探索

摘要

苹果最新设计语言 Liquid Glass 带来视觉革新，模拟玻璃质感与光影效果，提升用户体验。从拟物化到扁平化，再到 Liquid Glass，苹果设计语言不断进化，响应多元化信息呈现趋势。未来，二维与三维结合的交互方式将更加沉浸，技术革新将推动信息展示迈向新高度，数字世界将更加真实与自然。

登录后可查看文章图片

360技术：Agent skills：AI 能力扩展的新范式

摘要

Agent Skills让AI能力扩展平民化，用户无需编程即可定制AI功能。通过模块化设计，Claude能自动调用Skills处理文档、数据等任务，提升效率并确保准确性。与MCP相比，Skills更简单安全，适合标准化任务。官方提供预建Skills，支持自定义，未来AI定制时代已来，人类将更专注于创造与决策。

登录后可查看文章图片

‹ 2025-11-13 日报 2025-11-15 日报 ›