AI工程:AI Agent
AI Agent 是通过工程化的手段,为大语言模型提供了获取外部工具、知识的能力。他是介于人类、大语言模型之间的代理。当用户向 AI Agent 输入问题时,AI Agent 可以使用大语言模型作为推理引擎,将一个复杂的任务进行分解、给出任务执行规划。之后 Agent 会调用外部工具获取结果,并将大语言的上次推理和工具调用结果返回给大语言模型,让大语言模型继续思考、规划。如此循环,直到将一个复杂的任务完成。
使用 WebSocket 加速 Responses API 的智能体工作流
Codex通过优化API请求流程,显著提升了处理速度。采用WebSocket持久连接和缓存技术,减少了重复处理和历史数据加载的开销,使GPT-5.3-Codex-Spark的推理速度达到每秒1000个令牌,峰值可达4000。开发者无需调整现有API集成,即可享受更快的响应体验。
RAG已死?不,是Grep回归了!
RAG在代码搜索领域正被LLM驱动的Grep方案颠覆!Claude Code放弃向量索引,用多轮ripgrep暴力扫描实现零延迟检索,实测4,500文件仅需0.1秒。核心在于代码标识符天然适合精确匹配,且本地项目规模撑得住暴力搜索。虽然token消耗较高,但通过子Agent隔离、历史压缩等优化仍具实用性。这波技术迭代证明:特定场景下,简单直接的方案可能比复杂架构更高效。
通用 AI Agent 驱动网关路由安全审计实践
得物技术团队创新采用"通用Agent+业务Skill"架构,实现网关路由全量自动化漏洞检测。通过精细化越权分类、三维代码审计及危害评估机制,显著提升检测精度。独创MCP→CLI转换等优化策略,Token成本直降95%+,单次扫描成本仅0.23元。这套人机协同方案已成功捕获多个高危漏洞,为大规模API安全治理提供高效范式。
AI手工测试用例的实践进阶之路
传统手工测试用例面临信息碎片化、时间窗口压缩、个人经验依赖等问题。AI用例生成项目通过MVP验证方向,1.0阶段补齐输入解析、Prompt工程化等关键能力,最终沉淀为测试智能体平台。核心在于升级测试设计链路,实现多源输入协同、过程治理和资产闭环,提升覆盖质量与生成效率,推动测试工程体系智能化演进。
深入浅出Harness Engineerring之核心模式与理念
"Claude智能体架构深度解析:通过持久化指令、分层记忆和沙箱隔离实现高效任务处理。核心采用三件套解耦设计(Claude大脑+Harness控制器+Sandbox沙箱),支持多智能体协作模式。独创五层记忆体系从临时对话到长期知识库逐级沉淀,配合风险分级工具管理,在保证安全性的同时提升60-90%响应速度。智能体具备持续进化能力,通过辩证式用户建模实现越用越懂你的个性化服务。"
Harness Engineering实践,做了一个平台让AI一晚上自动评测和优化你的系统
AI评测平台实现全自动化测试与优化,支持无UI、带UI及系统级评测。AI自主生成评测集、执行测试并提交报告,还能基于结果自动优化系统。案例显示,钉钉文档MCP功能评测得分95分,绘报UI内容质量评测获85分,业务系统经三轮优化后评分从90.7提升至99.1。关键在于系统规范性和AI Coding含量,老系统断头路多则难以实现自动化。
用AI一个月做Unreal游戏能做到什么程度?
【AI+UE开发实战】新手仅用1个月,借助自研Loop-code工具将单机Demo改造成联机游戏!通过封装MCP插件实现IDE智能操控UE蓝图,解决状态同步、物理交互等核心难题。关键点:①工具支持一键部署+便携更新;②AI辅助完成90%代码/蓝图修改;③联机方案采用"后台服务+帧同步"架构。实践证明:AI擅长局部优化,全局设计仍需开发者把控。
AI 时代的 Git 版本管理,你用对了吗?
Agentic coding时代,Git工作流面临新挑战:Agent自主执行、并发协作导致意图模糊、提交混乱。推荐三大核心实践:隔离(分支保护+worktree)、透明(原子提交+结构化信息)、自动化(CI防护)。工具上可尝试Jujutsu的变更中心模型或GitButler虚拟分支,让版本历史成为可靠知识库。关键在于将规范显式化、工具化,适应AI协同开发新范式。
Agent Skills + Vibe Testing:构建人机协作的测试闭环
AI时代,Vibe Coding让代码生产提速,但质量保障如何跟上?Agent Skills和Vibe Testing给出答案。前者将测试经验打包成AI可调用的技能包,后者用AI探索式验证用户体验。从功能用例生成到缺陷定位,AI深度参与测试全流程,让质量保障从被动检查转向主动进化。当开发效率拉满,测试也需智能升级,人机协同才是未来。
你不知道的 Agent:原理、架构与工程实践
Agent架构的核心在于控制流、上下文工程、工具设计等关键环节。更贵的模型未必带来显著提升,工具描述准确性和评测系统质量才是关键。Agent循环稳定,通过感知、决策、行动、反馈四步运转,新增能力应叠加而非改动核心。上下文分层管理、工具面向目标设计、记忆系统外化是三大工程要点。OpenClaw案例展示了分层提示、安全边界等落地实践。
Harness Engineering实践心得:如何高效驾驭AI?
AI编程经历了从Prompt到Context再到Harness的三次跃迁,核心在于构建AI的“护栏”。Harness Engineering通过规则、技能和多Agent协作,确保AI稳定输出高质量代码。关键在于搭建环境、定义规则和自动化验证,使AI能独立完成任务,减少人工干预。每一次AI的失误都是优化系统的机会,逐步提升AI的自主性和可靠性。
柚漫剧 AI全流程提效拆解---从单点提效到工程融合
柚漫剧团队通过AI赋能,打通“需求-设计-开发-测试”全链路智能闭环,构建Prompt友好型PRD、AI Coding基建等核心能力,实现产研模式从“人力驱动”向“AI驱动”的范式跃迁。AI辅助产品经理提效,设计师聚焦效果精修,研发实现设计即代码,测试升级为AI Agent,推动产研协作效率大幅提升。
Harness不是目的,知识才是护城河 —— 一个AI工程交付团队的知识沉淀实践
Harness Engineering热潮下,真正护城河是私域知识沉淀而非复杂工作流。知识分层架构(五层存储×五种类型×三级成熟度)让团队经验结构化,工作流成为知识载体。独立Git仓库实现跨项目共享,渐进式索引确保精准查询,自动衰减机制维持知识活性。突破人机交互瓶颈的远程操控让工作流7×24小时流转,形成"交付即沉淀"的复利循环。模型会迭代,领域知识永存。
淘天营销中后台生码工作流最佳实践
营销中后台AI生码提效路径升级,统一收敛至云端托管生码,解决本地研发环境不一致、AK管理难等问题。构建跨仓库工作区,打造可编排场景化工作流,覆盖需求理解至构建发布全链路。迁移重构采用架构文档+领域Skill固化规则,日常迭代引入功能树实现精准知识供给,形成提效飞轮。核心方法论:精确知识、工程逻辑、知识正向循环。
高德AI伴行:构建全模态出行智能体
高德推出AI伴行,打造全模态出行智能体!它能听懂你的语音、看懂周围环境,结合实时位置提供精准指引。无论是找方向、规划路线,还是景区导览、建筑讲解,AI伴行都能像贴心朋友一样陪你出行。融合视觉识别、时空感知和行动引擎,让导航更智能、更人性化。4月下旬起全国陆续上线,出门带上它,探索世界更轻松!
来自字节跳动TRAE的Harness Engineering指南
Harness Engineering 是一套驾驭AI智能体的工程框架,旨在通过约束和引导,确保AI系统稳定可靠地运行。它将AI视为“野马”,通过设计专业装备和训练协议,使其成为卓越执行者。Harness Engineering 不改变模型本身,而是优化其运行环境和机制,解决AI在生产中的可靠性、效率、安全性和可追踪性问题,推动AI从玩具阶段迈向生产级应用。