知鸦日报2025-09-05

2025-09-04 16:30:00 ~ 2025-09-05 16:30:00

Технологии

阿里巴巴技术:如何让AI“看懂”网页?拆解 Browser-Use 的三大核心技术模块

摘要

Browser-Use利用大模型驱动,结合视觉识别和DOM分析,实现浏览器环境的感知与自动化操作。其核心是将LLM的语义理解与浏览器控制深度结合,支持多标签管理、元素追踪和自定义操作。通过智能决策和自纠错机制,Browser-Use能够处理复杂任务,减少因网页改版导致的脚本失效问题,推动浏览器自动化从规则驱动向认知驱动的转变。

运用 Elasticsearch 进行向量搜索及创建 RAG 应用

摘要

Elasticsearch作为全球最大搜索引擎,广泛应用于ToB业务。智能时代下,传统词汇搜索逐渐向向量搜索过渡,突破了语义和语言的限制。Elasticsearch支持密集向量和稀疏向量搜索,结合RAG技术,显著提升了搜索的准确性和召回率。通过混合搜索和多级排序,进一步优化了搜索体验。Elasticsearch在性能优化、多模态搜索和企业搜索中的应用案例展示了其强大能力。

Agent实战教程:如何从头开始使用LangGraph构建自己的DeepResearch(上)

摘要

本文探讨了使用LangGraph构建搜索研究智能体的过程,重点介绍了DeepResearch智能体的应用场景和构建方法。文章详细解析了研究范围界定、研究简报生成、提示语设计等关键步骤,并展示了如何通过多智能体架构和提示工程技术提升模型性能。此外,文章还介绍了研究智能体的构建流程,包括LLM决策节点、工具执行节点和研究压缩节点,以及如何通过上下文工程技术高效处理信息。

Agent实战教程:如何从头开始使用LangGraph构建自己的DeepResearch(下)

摘要

本文深入探讨了如何使用LangGraph构建多智能体系统,特别聚焦于DeepResearch项目中的监督者角色。通过上下文隔离和并行处理,系统能高效处理复杂查询,避免单一智能体的上下文冲突。监督者负责任务分配与进度评估,确保研究质量。文章还详细介绍了提示词设计、状态管理和多智能体架构,展示了如何从零搭建一个完整的DeepResearch系统。

滴滴技术:将 AI 融入工作流:滴滴前端工程师的研发效率提升笔记

摘要

AI-IDE正重塑软件开发,成为开发者的“技术顾问”与“代码实现者”。它能辅助需求分析、技术设计、代码生成、测试及优化等全流程。通过拆分任务、迭代优化,开发者可高效利用AI处理重复性工作,专注于创造性任务。AI的引入提升了代码质量与开发效率,关键在于合理引导与协作,充分发挥其潜力。


‹ 2025-09-04 日报 2025-09-06 日报 ›

qrcode

关注公众号
接收推送