知鸦日报2026-06-30

2026-06-29 16:30:00 ~ 2026-06-30 16:30:00

Tecnología

摘要

从MasterGo DSL到可维护HTML，信也科技构建了一条工程链路：先通过审计和AI复核生成可信baseline，再基于坐标推断出结构计划，将绝对定位重构为Flex布局。工程与视觉门禁确保代码质量，组件切片验收细节，最后用AI多轮小步修复差异。

登录后可查看文章图片

摘要

本文提出知识与代码底座的概念，将业务文档、代码仓库与历史经验组织成Agent可查询验证的上下文。通过LLM-Wiki沉淀主干知识，GitNexus生成代码导航，结合BM25检索与MCP工具化，让Agent的回答有据可查，降低研发上下文成本。

登录后可查看文章图片

摘要

Agent 工程化需将知识、工具、角色、权限、记忆与观测组织成可控体系。通过多角色 Profile 分权，配合 Langfuse Trace 记录行为链路，用 EvalOps 实现发布门禁与生产回流，确保云端服务稳定、可追责、可迭代。

登录后可查看文章图片

摘要

Netflix用GenPage替代传统多阶段推荐系统，通过一个生成式Transformer模型，将用户上下文作为提示，自回归地生成整个主页，包括行、实体和布局。该方法在A/B测试中提升了核心用户参与度指标，并将端到端延迟降低了20%。

摘要

Agent开发的核心瓶颈不在模型，而在工程化地"驾驭"它。核心公式是Agent=模型+驾驭工程。四条铁律至关重要：上下文越少越好，专才胜过通才，状态写在文件而非上下文里，约束编码为可执行规则而非文档。这像为野马造高速公路，决定系统能跑多稳多远。

登录后可查看文章图片

摘要

Claude代码能力的领先源于系统工程：可验证奖励强化学习、Constitutional AI安全护栏与产品数据飞轮三者共振。代码场景提供海量客观奖励信号，用户行为成为精准训练数据，形成自我加速的进化引擎，最终在SWE-bench实现断崖式领先。

登录后可查看文章图片

摘要

RedKnot发现KV Cache的价值按注意力头分化，而非均匀分布。它通过按头分类稀疏、稀疏FFN和SegPagedAttention存储，将算法、存储与内核粒度统一。实验显示，该方法在保持质量的同时，最高实现5.16倍TTFT加速，单卡并发提升7.8倍，预填充算力削减近80%。

登录后可查看文章图片

摘要

得物推荐用AI Harness体系将PDCA全链路工程化，让AI在结构化契约、零等待开发、自动评测和Bad Case沉淀中按目标生产。通过知识分层和混合Agent架构，实现从单点提效到系统复利，让工程协作可控、可度量、可复用。

登录后可查看文章图片

摘要

AI Coding 出码率飙升，研发整体提效却有限。瓶颈不在“写代码”，而在“理解、对齐、验证”等非编码环节。为此需构建Harness Engineering，为模型搭设可执行、可约束、可验证的工作环境，将工程关注点从模型输出转向任务稳定性。

登录后可查看文章图片

摘要

AI Coding 的本质是减少模型需要猜测的空间。提升效果的关键在于：用高密度上下文覆盖不确定性，并校准模型对业务真实约束的理解。新概念不必焦虑，只需判断它是在提高信息密度，还是缩小模型先验与业务现实的差距。

登录后可查看文章图片