知鸦日报2026-04-16

2026-04-15 16:30:00 ~ 2026-04-16 16:30:00

Product

AI 驱动:如何重构IP全流程设计?

摘要

AI技术正重塑IP设计流程,搜索团队“一定橙”案例展示了从传统手工制作到AI驱动的创新转型。通过模块化协同和多模态生成,AI提升了设计效率与创意表达,实现全链路自动化与风格统一。AI不仅压缩了前期创意周期,还大幅降低了人力成本,确保IP在多场景中的一致性。设计师需在AI时代守护创意与人文价值,以技术为工具,锚定自身不可替代性。

登录后可查看文章图片

Technology

Prompt caching in LLMs, clearly explained

摘要

AI对话缓存技术揭秘:静态前缀(系统指令/工具定义)与动态后缀(对话记录)分离存储,通过KV缓存机制复用已计算的关键值向量,实现90%成本削减。以Claude代码助手为例,30分钟会话中92%的缓存命中率将200万token费用从6美元压至1.15美元。核心法则:保持前缀哈希稳定(不改工具/模型),动态内容严格后置,像处理CPU缓存一样设计提示词架构。

登录后可查看文章图片

Using Claude Code: session management and 1M context

摘要

Claude Code的会话管理和上下文处理直接影响使用效果。百万token的大上下文窗口虽强,但过长会导致性能下降,称为"上下文腐化"。为解决这一问题,可通过重写、压缩、清理或创建子代理等方式优化上下文。合理使用这些功能,能有效避免冗余信息干扰,提升任务执行效率。使用时需根据任务特点选择合适策略,如连续任务保持会话,新任务则清理重启。

抽丝剥茧:深度解析 Hermes Agent 万字系统提示词(System Prompt)构成

摘要

Hermes agent的系统提示词结构复杂,包含身份定义、记忆指南、技能索引等模块,总字符数约36,700。通过优化AGENTS.md文件加载路径,可减少50%的tokens消耗,提升效率。技能索引虽丰富,但需警惕Skill泛滥问题。系统提示词的合理调整能显著提升Hermes的性能表现。

登录后可查看文章图片

Similar image search (ambience)

摘要

作者分享了一个自托管照片库引擎的图像检索系统,包含多个微服务,支持反向图像搜索、相似图像搜索及图像标注等功能。系统使用FastAPI和LMDB等技术,结合FAISS构建搜索索引,提升了检索效率。通过多种算法(如phash、颜色直方图、局部特征等)实现不同场景下的图像检索,还尝试了深度学习模型BEiT和CLIP进行语义搜索,增强了系统的智能化水平。

登录后可查看文章图片

服装2d图片去重方案

摘要

基于pHash感知哈希技术实现图像去重:通过DCT变换提取64位指纹,汉明距离≤5判定相似;搭配FAISS实现毫秒级精准搜索,10万级查询仅需3.2MB内存。该方案对尺寸/亮度变化鲁棒,但对几何变形敏感,适合电商等通用场景。

登录后可查看文章图片

从聊天窗口到多 Agent 控制台:一次 AI 编程协作范式的转移

摘要

随着AI编程占比提升,单Agent协作模式已显不足。作者探索多Agent并行工作,提出以Review为中心的协作范式,设计了Mexus工具,支持多Agent管理、观测与协调,强调结构化的spec定义与轻量claim机制,实现高效、可观测的多Agent编程环境,推动人与AI分工优化。

登录后可查看文章图片

关注流推模式的具体应用

摘要

Feed流推模式通过"写扩散"将内容实时推送至粉丝列表,以空间换时间提升读取效率。早期采用Redis缓存+DB兜底策略,但面临存储膨胀、推送延迟等问题。通过懒加载同步推送近期数据、长度控制器裁剪列表、延迟推防刷屏、非活跃粉丝过滤等优化手段,平衡性能与体验。核心设计融合冷热分离、工厂模式解析、布隆过滤器等思想,适用于关注量少粉丝少的场景,为后续拉模式奠定基础。

登录后可查看文章图片

pinterest技术:Finding zombies in our systems: A real-world story of CPU bottlenecks

摘要

小编发现Pinterest的ML训练任务因网络中断频繁崩溃,排查发现是AWS ENA驱动重置导致。深入分析后,发现是僵尸内存控制组(memcg)堆积引发CPU资源争抢,进而饿死网络线程。罪魁祸首竟是系统默认启动的ECS代理持续崩溃产生泄漏。关闭该服务后问题解决,同时揭露了跨可用区配置差异的乌龙事件。核心教训:警惕系统默认服务,善用性能分析工具,环境一致性至关重要。

Bash is the SQL for file systems

摘要

云服务商普遍存在的"出口流量费"问题让客户头疼,但数据库服务却很少被抱怨。奥秘在于:数据库只返回查询结果(几KB),而传统文件系统需要下载全部数据(可能上百GB)再本地处理。这启发我们开发了革命性的"无服务器执行"文件系统——用户发送操作指令(如bash命令),系统在存储端直接运算后仅返回结果,彻底规避流量费和延迟问题。这种内置计算能力的文件系统将重塑开发生态,尤其适合AI代理等有状态应用场景。

用 Claude Code 将三万行 Go 项目移植到 Rust:Agent Team 实践与 Harness 效率优化

摘要

用Rust重写Clash Meta内核,通过Claude Code的Agent Team机制实现高效协作。四个AI角色分工明确:架构师决策、项目经理排期、工程师编码、QA测试,配合文档驱动开发。关键经验包括:优化CLAUDE.md提升效率、里程碑边界重启Agent、精简Memory系统、严格测试验证。最终产出11个crate、3.1万行代码,验证了AI在大型工程项目的实用价值。

登录后可查看文章图片

我们如何把直播间首屏体验提升80%?——上篇

摘要

直播首屏秒开是用户体验的第一道门槛。通过拆解调度、建连、解码等关键链路,团队将Android首屏P98耗时从1.5s压至660ms,iOS从1.7s降至1s内。优化分四阶段推进:先砍调度冗余耗时,再抠解码细节,接着优化网络建连,最后打磨渲染环节。核心沉淀出一套"监控校准-瓶颈定位-收益评估-分阶段验证"的方法论,让模糊的体验问题变成可量化改进的技术命题。

登录后可查看文章图片

OpenClaw 落地到生产实际应用的一种可能的路径

摘要

Coding Agent跑得快,得益于代码世界的可视化、封闭性、可验证和可回滚特性。业务Agent难落地,因业务环境开放、分散且难撤销。要让Agent稳定执行,需重构业务环境:可视化任务、封闭工作单元、建立验证层和回滚机制。Amazon的沙盘实践证明,代理现实操作空间是关键。未来需将业务动作转化为可审阅产物,并前置高风险决策到沙盘推演。

登录后可查看文章图片

OpenClaw Agent与Skill架构详解

摘要

OpenClaw 是一个强大的 AI Agent 框架,解决了多渠道消息处理、长时运行 Agent 和灵活知识扩展等痛点。它通过 Skill 机制动态注入领域知识,支持主子 Agent 并行执行任务,具备多层容错机制确保系统可靠性。OpenClaw 基于 pi-mono 扩展,提供生产级的多用户、多渠道支持,适用于复杂场景的 AI 应用。

登录后可查看文章图片

一个问题变成 50 条 SQL:AI Agent 是怎么问数据库的?

摘要

AI Agent搞数据分析时,会疯狂生成大量SQL并发查询,传统数据库根本顶不住!StarRocks用三招搞定:①向量化引擎+资源隔离扛住机器级并发;②查询反馈机制自动优化AI生成的烂SQL;③语义视图+知识库确保查询结果符合业务口径。这波操作让AI既能撒欢查数据,又不会把系统搞崩或算错数~

登录后可查看文章图片

OpenClaw的启示:身份权限管理是AI Agent时代的阿喀琉斯之踵

摘要

AI代理权限失控危机:OpenClaw等智能体被曝存在三大致命漏洞——过度权限导致系统风险、未认证实例暴露、远程代码执行漏洞。传统身份管理方案失效,专家提出新框架:身份传播切断越权链条、无密钥验证防止凭证泄露、上下文感知识别异常行为、意图感知拦截逻辑攻击。AWS和Azure已推出针对性解决方案,字节跳动也研发了双向认证体系,通过入站身份绑定和出站网关管控实现动态防护。(139字)

登录后可查看文章图片

拍图识款在转转的进阶实践

摘要

“拍图识款”通过图像检索技术,在海量SKU库中匹配商品款式,提升效率与准确性。转转自研系统采用度量学习,融合Logo、包型、材质等特征,优化细粒度识别。系统架构涵盖主体检测、特征提取与向量检索,结合SKU属性约束,实现精准召回。落地于商品挂接与用户识款场景,显著提升复杂背景下的识别效果。未来将探索多模态融合,进一步优化识款能力。

登录后可查看文章图片

utoo:新一代基于 Rust 的 npm 包管理器

摘要

支付宝体验技术部推出基于Rust重构的npm包管理器utoo,主打极致性能与完整兼容。冷启动速度提升76倍至1秒,缓存体积压缩至3.4MB,国内网络环境自动加速。原生支持package-lock.json和npm标准布局,实现零迁移成本。实测在antd、egg等项目中CI效率提升2-7倍,Windows平台优化尤为显著。通过Rust多线程、三级缓存等设计,兼顾性能与生态兼容性。

登录后可查看文章图片

生成式召回在得物的落地技术分享与思考

摘要

生成式AI为推荐系统带来新机遇,得物社区探索生成式召回,提升内容多样性与新颖性。采用Generative与Rerank模型联合训练,实现端到端优化。实验表明,核心消费指标显著提升,多样性改善。未来将聚焦框架迁移、架构升级、推理加速与成本优化,推动模型能力升级,探索与LLM结合及多模态跨域生成的可能性。

OpenClaw长期记忆:优秀管线与玄学效果

摘要

AI Agent的记忆系统面临稳定性挑战!OpenClaw采用Markdown文件存储记忆,依赖LLM自主决策写入和整理,存在遗漏风险。RDSClaw记忆插件通过实时结构化提取和语义整合补强,在LoCoMo10评测中准确率提升13.9%。双管线设计让AI既记住用户偏好,又能积累自身经验,实现跨会话的稳定记忆。

登录后可查看文章图片

读完 Claude Code 源码才发现:Skills、MCP、Rules 的区别,远没有你想的那么大

摘要

Claude Code的Rules、MCP、Skills三大机制本质都是通过API参数位置实现:Rules是项目级行为规范,被动注入messages;MCP是标准化工具协议,在system和tools注册外部服务;Skills通过tool_use触发后注入指令文本。三者的核心区别在于信息在请求中的位置,而非功能本身。MCP适合需要状态管理的场景,Skills依赖提示词质量,Rules则适合长期生效的规范。源码揭示这些概念远没有宣传的玄乎,底层都是对API参数的灵活运用。

登录后可查看文章图片

淘宝动效解决方案分享

摘要

淘宝推出了一套全链路动效解决方案,覆盖设计到播放全流程。通过AE插件实现动效检测优化,可视化编辑器支持动态元素调整,跨端播放器统一H5/Weex体验。方案创新性地解决了动效布局(align/group)、二进制压缩、代码生成等核心痛点,支持动态内容替换与AI辅助编辑,实现"一次制作多端复用"。该体系显著提升了动效生产效率与多端一致性,为业务提供了更智能可控的动效支持。

登录后可查看文章图片


‹ 2026-04-15 日报 2026-04-17 日报 ›

qrcode

关注公众号
接收推送