知鸦日报2025-09-13

2025-09-12 16:30:00 ~ 2025-09-13 16:30:00

Технологии

Meta如何给RAG做Context Engineering,让模型上下文增加16倍

摘要

Meta超级智能实验室提出的REFRAG框架,通过智能压缩上下文,解决了RAG与Agent长上下文处理中的高内存成本和冗余计算问题。该框架采用分块压缩、选择性扩展和高效推理策略,显著提升了首token生成速度和上下文处理长度,特别适用于RAG、多轮对话和长文档摘要等高吞吐量场景。

我写出了 Threejs 版城市天际线?!

摘要

何贤因忙碌鸽了两个月,最近开发了一款基于Three.js和Vue的城建游戏《CubeCity》。游戏包含建造、选择、搬迁、拆除四种模式,通过Pinia管理元数据,Three.js呈现3D场景。项目虽为整活,但涉及复杂技术栈,未来或开专栏详解开发过程。何贤表示,后续将聚焦Three.js的视觉创意领域,而非深度游戏开发。开源虽好,但维护成本高,商业化仍是难题。

腾讯技术:大模型提示词技巧Prompt Engineering,看这一篇就够了

摘要

想让大模型听话,关键在于写好Prompt。通过角色/任务、核心原则、上下文处理、CoT、输出规范和Few-Shot等模块,可以有效提升模型的准确性。角色定位明确任务,核心原则确保执行方向,上下文处理优化信息输入,CoT引导逻辑思考,输出规范统一结果格式,Few-Shot提供实例参考。这套方法适用于复杂场景,帮助你写出满意的Prompt,让模型更听话。

Writing effective tools for AI agents—using AI agents

摘要

Model Context Protocol (MCP) 赋能 LLM 代理,通过工具提升任务解决能力。优化工具需构建原型、评估性能,并与代理协作迭代改进。高质量工具应明确功能边界、返回有效上下文、优化响应效率,并精心设计工具描述。通过系统化评估,确保工具与代理协同进化,应对复杂任务。

登录后可查看文章图片


‹ 2025-09-12 日报 2025-09-14 日报 ›

qrcode

关注公众号
接收推送