知鸦日报2025-04-30

2025-04-29 16:30:00 ~ 2025-04-30 16:30:00

기술

马蜂窝技术：马蜂窝自研旅游行业大模型

摘要

马蜂窝推出自主研发的旅行大模型mfw-32B，已成功部署至APP。该模型在行程规划能力上与DeepSeek-R1持平，但在响应速度、资源占用及降低幻觉等方面表现更优。通过SFT微调和强化学习，mfw-32B在个性化需求提取、时间窗管理、预算优化及行程生成上均有显著提升，为用户提供更智能、高效的旅行体验。

小红书是怎么用云的？

摘要

小红书在云原生实践中，通过阿里云ACK和ECS构建稳固云基座，结合OpenKruise和Koordinator开源项目，解决了有状态应用编排和资源调度难题。采用“大Node小Pod”策略，提升混部效率和集群资源利用率，优化了深度学习和大数据处理性能。通过深度参与开源社区，小红书实现了技术架构的持续演进和业务价值的最大化。

meta技术：Introducing AutoPatchBench: A Benchmark for AI-Powered Security Fixes

摘要

AutoPatchBench是一个用于评估AI修复模糊测试漏洞的基准工具，包含136个真实C/C++漏洞及其修复方案。通过自动化的构建、模糊测试和差分测试，验证AI生成补丁的正确性。基准工具旨在推动AI辅助漏洞修复技术的发展，提供标准化评估框架，促进研究透明性和可重复性。AutoPatchBench现已开源，支持开发者测试和改进自动补丁工具。

Introducing AutoPatchBench: A Benchmark for AI-Powered Security Fixes

Late Chunking in Long-Context Embedding Models

摘要

长文本嵌入模型中，传统分块嵌入法在处理长距离依赖时存在信息丢失问题。为解决这一难题，提出“延迟分块”策略，先对全文进行嵌入，再分块处理，保留上下文信息。实验表明，该方法在长文档检索任务中表现优异，尤其在文档长度较大时效果显著。延迟分块有效提升了检索质量，验证了长上下文嵌入模型的价值。

Late Chunking in Long-Context Embedding Models

告别碎片化！两大先进分块技术如何提升RAG的语义连贯性？

摘要

检索增强生成（RAG）系统通过结合自然语言处理与信息检索技术，解决了传统大语言模型依赖静态数据的局限。文章探讨了两种分块策略：延迟分块保留全局上下文，提升效率；上下文增强检索通过LLM生成附加信息，提升语义连贯性。实验表明，延迟分块适合资源有限场景，上下文检索则在高精度需求下表现更优。未来需平衡效率与效果，优化长文档处理。

One line of code that did cost $8,000

摘要

Screen Studio屏幕录制应用因自动更新功能的bug，导致每个用户每5分钟重复下载250MB的更新文件，持续一个月。这造成了900万次下载和超过2PB的流量消耗，给Google Cloud带来了巨大费用。问题源于更新代码中遗漏了停止下载的指令，且许多用户长时间后台运行应用。未设置费用报警，直到信用卡交易被拦截才被发现。部分用户因此面临网络流量超限问题，团队决定承担相关责任。

七猫技术：AI 辅助编程工程化：让一切变得可控且高效

摘要

AI辅助编程虽强大但存在不稳定问题，如何让它更可控？关键在于工程化！通过制定详细提示词文件（如create_po.md），明确生成代码的格式规范，结合工具链实现自动化操作。实战案例展示用cursor工具自动生成Go实体文件的全流程：连接数据库→提取表结构→按模板生成代码→人工核验。提示词文件需像代码般精心维护，每次AI产出必须人工审核，这才是AI编程落地的正确姿势。

七猫技术：AI 之结构化prompt修炼

摘要

结构化Prompt通过清晰的层级和语义提示，大幅提升了ChatGPT的理解和输出质量。它像写文章一样组织Prompt，使用模板如CRISPE框架，明确角色、背景、指令等，使模型输出稳定且高效。实践案例展示了如何利用结构化Prompt自动生成代码和Proto文件，显著提高开发效率，便于团队协作和维护。掌握结构化Prompt是未来AI应用的关键技能。

七猫技术：浅议 Cursor 在前端开发流程中的表现

摘要

Cursor 的图生代码功能在前端开发中表现亮眼，尤其在ToC和ToB项目中，能快速生成页面结构和组件拆分，大幅提升开发效率。尽管样式细节仍有改进空间，但其功能还原度较高。通过接入 Figma-MCP，Cursor 能更精准解析设计稿，简化开发流程，尤其在处理后台页面时效果显著。总体而言，Cursor 在前端开发中提供了高效的辅助支持。

七猫技术：AI 时代的 Code Review 最佳实践

摘要

随着AI辅助编程技术的成熟，开发流程也在不断进化，代码评审（CR）工作逐渐左移至IDE内进行。通过定制CR规则，开发者可以在代码变更、提交前后随时进行评审，提升代码质量。Cursor、Github Copilot和通义灵码等工具支持在IDE内实现CR功能，帮助开发者发现代码中的问题。未来，云效AI智能CR将进一步提升自动化评审能力，推动开发效率和质量的双重提升。

meta技术：How Meta understands data at scale

摘要

Meta通过“隐私感知基础设施”（PAI）应对大规模数据管理的挑战，采用“左移”策略，在开发初期集成数据模式化和标注。构建了统一的隐私分类法，标准化数据隐私管理。通过自动化分类和机器学习模型，Meta实现了对数百万数据资产的高效理解和保护，确保隐私考虑嵌入产品开发的每个阶段，推动数据驱动的创新和合规管理。

浅谈知识蒸馏

摘要

随着AI技术的普及，自然语言处理应用广泛，但大模型因计算资源需求高，难以在移动设备上运行。知识蒸馏技术应运而生，通过将大模型的知识传授给小模型，解决这一问题。小模型在保持低计算成本和小存储空间的同时，能在移动设备上快速实现语音交互、文本处理等功能，显著降低应用模型所需的计算成本和存储需求。未来，知识蒸馏技术将继续发展，以适配多样化的大模型生态。

360技术：基于LangChain ReAct Agents构建RAG问答系统

摘要

LLM在处理私有数据时易产生“幻觉”，RAG技术通过检索外部知识库辅助回答，但在多步推理问题上仍有局限。本文引入LangChain ReAct Agents，结合ReAct框架，通过“思考-行动-观察”循环提升复杂任务表现。系统使用Qdrant向量数据库和LangChain工具，实现多步推理与知识检索，显著提高回答准确性。

‹ 2025-04-29 日报 2025-05-01 日报 ›