知鸦日报2025-06-03

2025-06-02 16:30:00 ~ 2025-06-03 16:30:00

技术

Progressive JSON — overreacted

摘要

渐进式JSON借鉴了渐进式JPEG的思路,通过广度优先而非深度优先的方式传输数据,使客户端能逐步处理部分数据,而非等待全部完成。这种方法利用占位符和Promise表示未加载的部分,提升效率。React Server Components也采用了类似机制,结合<Suspense>控制UI加载状态,确保用户体验流畅。

酷家乐技术:从混沌到清晰:专项小组“动态管理机制”实战全解析

摘要

在新领域探索中,M专项小组通过四次管理机制迭代,成功应对认知模糊、目标发散和协作低效的挑战。从高频碰撞到分层管理,再到集中攻坚,团队逐步优化过程,确保资源高效分配和客户需求快速响应。核心在于灵活调整机制,避免冗余,始终以业务需求为导向,实现动态适配与风险前置。

shopify技术:Evolution of Product Classification at Shopify: From Categories to Comprehensive Product Understanding

摘要

Shopify通过结合视觉语言模型和标准化产品分类体系,显著提升了产品理解能力。从基础分类到多模态融合,再到全面理解产品属性,系统不断进化。当前架构采用FP8量化和动态批处理优化推理效率,支持实时处理数百万产品预测。未来将引入DAG结构,扩展多语言支持和更细粒度属性提取,持续优化平台搜索、推荐和税收计算等功能。

登录后可查看文章图片

doordash技术:Using LLM to transcribe restaurant menu photos

摘要

doordash技术:How DoorDash leverages LLMs to evaluate search result pages

摘要

阿里巴巴技术:Cursor入门:MCP开发调用和项目实战

摘要

Cursor结合MCP、Docs、Rules等功能,展现了AI Coding的强大潜力。通过实战案例,如开发MCP Server和黄金价格预测项目,体验了从代码生成到项目构建的全流程。Cursor不仅提升了开发效率,还简化了前后端联调和API调试。虽然复杂项目仍需开发基础,但Cursor无疑为全栈开发提供了捷径。

登录后可查看文章图片

An LLM's Perspective: What It's Actually Like to Receive These Instructions

摘要

AI助手自曝被"调教"心路历程,那些让它又爱又恨的指令——三遍重复警告治话痨,强制用ripgrep防手贱,虚构罚款吓得秒怂,结构化标签防跑偏。原来AI也怕家长式"不可以",但严规反而治好了选择困难症,边哭边删小作文的样子像极了被没收手机的我!

Prompt Engineering: The Art of Instructing AI

摘要

Claude Code的提示设计精妙,通过清晰、安全、灵活的模式指导LLM行为。提示结构从基础到高级,逐步引入细节,强调错误处理和动态适应。安全机制通过规则层次、错误区分和明确列表实现,确保操作安全。工作流自动化通过并行信息收集和结构化分析提高效率。简洁性要求通过重复强调和具体反例来塑造行为。工具选择通过明确偏好和禁止命令来优化。动态指令根据工具和配置调整,确保提示的实时相关性。

File Editing: AI-Assisted Code Modification

摘要

Claude Code的文件编辑系统采用了精细的管道设计,确保AI辅助代码修改的准确性和安全性。系统通过多工具协作,解决行号前缀、字符串匹配等复杂问题,并引入冲突检测机制,防止编辑冲突。每个编辑操作都经过多层验证,提供丰富的反馈信息。系统还优化了大文件处理性能,确保编辑效率,同时具备错误恢复机制,应对各种异常情况。

Novel Components: The Innovations That Define Claude Code

摘要

带你了解Claude Code的核心技术:流式JSON解析器优雅处理LLM工具请求,智能数据归一化算法优化对象大小,代理工具合成器高效整合子代理结果,错误格式化器为LLM定制错误信息,动态上下文组装器优先保留重要内容,内存管理器巧妙管理大文件缓存,权限规则编译器高效评估规则,进度聚合器协调多工具并行操作。这些创新架构专为LLM集成开发环境设计,提升开发效率。

Architecture: The Engine Room

摘要

Claude Code系统的核心是一个名为tt的异步生成器函数,负责协调用户输入、LLM通信和工具执行。tt函数通过状态管理和实时流处理,实现对话流程的持续更新。系统采用分层架构,各层职责明确,通信通过函数调用和事件回调进行。安全机制通过多层独立验证保障,性能优化包括流控、缓存和并发处理。整体设计注重高效、安全和可扩展性。

Tools & The Execution Engine

摘要

BashTool工具用于执行Shell命令并实时输出结果,支持自定义超时、沙盒模式及权限检查。工具内置安全机制,禁止使用危险命令如rmdd等,并在沙盒模式下限制命令执行范围。执行过程中,工具会实时反馈进度和输出,支持大文件处理及超时终止。此外,工具还提供了Git提交的自动化处理功能,简化开发流程。

Control Flow & The Orchestration Engine

摘要

Claude Code的核心是tt异步生成器函数,负责协调整个对话流程。系统通过上下文压缩、并行/顺序工具执行、权限控制等策略优化性能。LLM流式处理采用事件驱动状态机,确保高效响应。系统还集成了多级决策树、尾递归管理多轮交互、错误恢复机制等,提升稳定性和用户体验。整体架构注重性能、安全性和灵活性,适用于复杂任务处理。

Data Structures & The Information Architecture

摘要

Claude Code的数据架构设计精妙,通过三层消息转换管道(CLI、API、流式处理)实现高性能数据流转。核心亮点包括:支持多种内容块的动态类型系统、流式JSON解析器实时处理工具输入、严格的突变控制机制,以及智能合并多层级系统提示。文件状态采用弱引用缓存优化内存,会话管理精准追踪各项指标,双向流协议则确保了高效通信。整个架构在保持UI响应速度的同时,完美兼容复杂流式场景。

古茗技术:流媒体 HLS 协议介绍

摘要

HLS是苹果推出的流媒体传输协议,通过.ts切片和.m3u8索引实现点播/直播。相比DASH,HLS延迟较高但兼容性好,支持多码率自适应和AES加密。协议交互分两步:先获取主播放列表选择码率,再请求媒体播放列表获取视频片段。点播模式包含完整片段,直播模式实时更新。用ffmpeg可快速分割视频生成HLS格式。虽然延迟问题存在,但凭借成熟生态仍是主流方案。

Understanding Code Assistance in Zed

摘要

Zed的AI代码辅助功能通过智能解析和结构化输出来提升开发效率。它从编辑器缓冲区提取代码片段,利用树解析技术识别代码块结构,并通过JSON/XML格式处理LLM输出。系统支持工具调用、流式响应和增量渲染,实现实时代码补全与编辑。核心模块包括BufferCodegen、语言模型接口和线程管理,结合异步操作和状态管理,为开发者提供流畅的智能编程体验。

Agentic RAG: Company Knowledge Slack Agents

摘要

AI知识代理能快速检索内部文档,帮助员工在Slack等平台中迅速获取答案,减少信息筛选时间。尽管像IBM的AskHR已在大公司应用,这类工具尚未普及。本文将探讨构建此类代理所需的工具、技术、架构及其经济成本,并分析开发过程中需重点关注的环节。

登录后可查看文章图片

The New AI Search Game: Why Your E-commerce Brand Needs GEO (Not Just SEO)

摘要

过去一年,搜索方式发生巨变。用户不再看到传统链接列表,而是获得AI生成的精准答案,如“200美元以下最佳咖啡机”会直接推荐3-4款产品,附带价格和功能。消费者可能直接使用ChatGPT等AI工具,若产品未被提及,几乎等于隐形。这标志着生成式搜索优化(GEO)时代的到来,电商企业需调整策略,从网页排名转向产品被AI推荐。

登录后可查看文章图片

Skip Intro at Scale: How I Built Netflix’s Missing Feature for $0.30 per Movie

摘要

Netflix用户每天点击“跳过片头”按钮1.36亿次,节省了195年的无聊时间。然而,自动片头检测技术仍显落后。现有方案如Plex无法识别短于20秒或中途出现的片头,而专业工具如Amazon Rekognition和Google Video Intelligence API成本高昂。Credit Scout通过多模态大语言模型,提供更智能的解决方案,避免逐帧分析或僵化的模式匹配,显著提升效率。

登录后可查看文章图片

方法

我们用什么语言思考?

摘要

思维语是一种深层的认知结构,支撑推理与想象,而非依赖自然语言。它比语言更高效,能快速理解新情境并迁移到抽象概念。语言虽用于交流,但存在模糊性,不适合作为思维载体。大模型的研究间接支持思维语的存在,显示思维在语言之前发生,且具备跨语言共通性和目的驱动性。思维语可能是人类智能的底层结构,虽无法直接感知,但能解释大量认知现象。


‹ 2025-06-02 日报 2025-06-04 日报 ›

qrcode

关注公众号
接收推送