知鸦日报2026-06-30

2026-06-29 16:30:00 ~ 2026-06-30 16:30:00

Tecnología

从绝对定位到可维护页面:一次MasterGo还原链路的实战复盘

摘要

从MasterGo DSL到可维护HTML,信也科技构建了一条工程链路:先通过审计和AI复核生成可信baseline,再基于坐标推断出结构计划,将绝对定位重构为Flex布局。工程与视觉门禁确保代码质量,组件切片验收细节,最后用AI多轮小步修复差异。

登录后可查看文章图片

七猫技术:Agent 工程化实践系列(一):构建可追溯的知识与代码底座

摘要

本文提出知识与代码底座的概念,将业务文档、代码仓库与历史经验组织成Agent可查询验证的上下文。通过LLM-Wiki沉淀主干知识,GitNexus生成代码导航,结合BM25检索与MCP工具化,让Agent的回答有据可查,降低研发上下文成本。

登录后可查看文章图片

七猫技术:Agent 工程化实践系列(二):云端 Agent 协作与 EvalOps 治理

摘要

Agent 工程化需将知识、工具、角色、权限、记忆与观测组织成可控体系。通过多角色 Profile 分权,配合 Langfuse Trace 记录行为链路,用 EvalOps 实现发布门禁与生产回流,确保云端服务稳定、可追责、可迭代。

登录后可查看文章图片

netflix技术:GenPage: Towards End-to-End Generative Homepage Construction at Netflix

摘要

Netflix用GenPage替代传统多阶段推荐系统,通过一个生成式Transformer模型,将用户上下文作为提示,自回归地生成整个主页,包括行、实体和布局。该方法在A/B测试中提升了核心用户参与度指标,并将端到端延迟降低了20%。

给野马套上缰绳:Agent Harness 工程实践 ——从范式理论到钉钉AI招聘的真实落地

摘要

Agent开发的核心瓶颈不在模型,而在工程化地"驾驭"它。核心公式是Agent=模型+驾驭工程。四条铁律至关重要:上下文越少越好,专才胜过通才,状态写在文件而非上下文里,约束编码为可执行规则而非文档。这像为野马造高速公路,决定系统能跑多稳多远。

登录后可查看文章图片

万字长文推演Claude的代码统治力从何而来

摘要

Claude代码能力的领先源于系统工程:可验证奖励强化学习、Constitutional AI安全护栏与产品数据飞轮三者共振。代码场景提供海量客观奖励信号,用户行为成为精准训练数据,形成自我加速的进化引擎,最终在SWE-bench实现断崖式领先。

登录后可查看文章图片

让 KV Cache「按头分家」:小红书 RedKnot 如何重做长文本推理新引擎

摘要

RedKnot发现KV Cache的价值按注意力头分化,而非均匀分布。它通过按头分类稀疏、稀疏FFN和SegPagedAttention存储,将算法、存储与内核粒度统一。实验显示,该方法在保持质量的同时,最高实现5.16倍TTFT加速,单卡并发提升7.8倍,预填充算力削减近80%。

登录后可查看文章图片

从狂野代码到按目标生产:得物推荐 AI Harness 的工程化实践

摘要

得物推荐用AI Harness体系将PDCA全链路工程化,让AI在结构化契约、零等待开发、自动评测和Bad Case沉淀中按目标生产。通过知识分层和混合Agent架构,实现从单点提效到系统复利,让工程协作可控、可度量、可复用。

登录后可查看文章图片

开启Harness Engineering探索之旅

摘要

AI Coding 出码率飙升,研发整体提效却有限。瓶颈不在“写代码”,而在“理解、对齐、验证”等非编码环节。为此需构建Harness Engineering,为模型搭设可执行、可约束、可验证的工作环境,将工程关注点从模型输出转向任务稳定性。

登录后可查看文章图片

AI Coding 的底层框架:一切优化都是在对抗熵增

摘要

AI Coding 的本质是减少模型需要猜测的空间。提升效果的关键在于:用高密度上下文覆盖不确定性,并校准模型对业务真实约束的理解。新概念不必焦虑,只需判断它是在提高信息密度,还是缩小模型先验与业务现实的差距。

登录后可查看文章图片


‹ 2026-06-29 日报 2026-07-01 日报 ›

qrcode

关注公众号
接收推送