2026-06-29 16:30:00 ~ 2026-06-30 16:30:00
从MasterGo DSL到可维护HTML,信也科技构建了一条工程链路:先通过审计和AI复核生成可信baseline,再基于坐标推断出结构计划,将绝对定位重构为Flex布局。工程与视觉门禁确保代码质量,组件切片验收细节,最后用AI多轮小步修复差异。
登录后可查看文章图片
本文提出知识与代码底座的概念,将业务文档、代码仓库与历史经验组织成Agent可查询验证的上下文。通过LLM-Wiki沉淀主干知识,GitNexus生成代码导航,结合BM25检索与MCP工具化,让Agent的回答有据可查,降低研发上下文成本。
登录后可查看文章图片
Agent 工程化需将知识、工具、角色、权限、记忆与观测组织成可控体系。通过多角色 Profile 分权,配合 Langfuse Trace 记录行为链路,用 EvalOps 实现发布门禁与生产回流,确保云端服务稳定、可追责、可迭代。
登录后可查看文章图片
Netflix用GenPage替代传统多阶段推荐系统,通过一个生成式Transformer模型,将用户上下文作为提示,自回归地生成整个主页,包括行、实体和布局。该方法在A/B测试中提升了核心用户参与度指标,并将端到端延迟降低了20%。
Agent开发的核心瓶颈不在模型,而在工程化地"驾驭"它。核心公式是Agent=模型+驾驭工程。四条铁律至关重要:上下文越少越好,专才胜过通才,状态写在文件而非上下文里,约束编码为可执行规则而非文档。这像为野马造高速公路,决定系统能跑多稳多远。
登录后可查看文章图片
Claude代码能力的领先源于系统工程:可验证奖励强化学习、Constitutional AI安全护栏与产品数据飞轮三者共振。代码场景提供海量客观奖励信号,用户行为成为精准训练数据,形成自我加速的进化引擎,最终在SWE-bench实现断崖式领先。
登录后可查看文章图片
RedKnot发现KV Cache的价值按注意力头分化,而非均匀分布。它通过按头分类稀疏、稀疏FFN和SegPagedAttention存储,将算法、存储与内核粒度统一。实验显示,该方法在保持质量的同时,最高实现5.16倍TTFT加速,单卡并发提升7.8倍,预填充算力削减近80%。
登录后可查看文章图片
得物推荐用AI Harness体系将PDCA全链路工程化,让AI在结构化契约、零等待开发、自动评测和Bad Case沉淀中按目标生产。通过知识分层和混合Agent架构,实现从单点提效到系统复利,让工程协作可控、可度量、可复用。
登录后可查看文章图片
AI Coding 出码率飙升,研发整体提效却有限。瓶颈不在“写代码”,而在“理解、对齐、验证”等非编码环节。为此需构建Harness Engineering,为模型搭设可执行、可约束、可验证的工作环境,将工程关注点从模型输出转向任务稳定性。
登录后可查看文章图片
AI Coding 的本质是减少模型需要猜测的空间。提升效果的关键在于:用高密度上下文覆盖不确定性,并校准模型对业务真实约束的理解。新概念不必焦虑,只需判断它是在提高信息密度,还是缩小模型先验与业务现实的差距。
登录后可查看文章图片
关注公众号
接收推送