话题AI工程 › RAG

AI工程:RAG

关联话题: GraphRAG、Retrieval-Augmented Generation、检索增强生成

AI+BI的数据智能问答探索与实践

光大银行推出“问数”智能分析工具,融合AI大模型与BI可视化技术,实现对话式数据问答。该工具采用Text2DSL技术路线,支持用户对已有报表数据指标的问答场景,通过知识召回、提示词工程、DSL拼接和结果整理四大核心环节,提升数据分析效率与用户体验。问答准确率优化策略包括领域微调训练、多阶段重排序、交互式歧义消除和大模型幻觉识别机制,确保查询精准性。“问数”工具已服务2600余名用户,未来将持续拓展数据范围与技术适配能力,助力银行数据驱动增长。

从0到1搭建一个智能分析OBS埋点数据的AI Agent

通过AI Agent自动生成SQL查询,解决Grafana数据分析中的痛点。利用RAGFlow理解表结构,封装查询API为Tool,构建OBS Agent实现数据查询与分析自动化。结合Trae工具,优化Prompt设计,最终生成详细数据分析报告,提升数据分析效率与灵活性。

数据库AI方向探索-MCP原理解析&DB方向实战

MCP(Model Context Protocol)是一种开放标准协议,旨在统一大型语言模型与外部数据源、工具及服务的交互方式。通过JSON-RPC 2.0定义通信规则,MCP采用客户端-服务器模式,包含MCP Host、MCP Client和MCP Server三个关键组件。它整合了RAG和Function Calling技术,提供标准化接口,扩展AI能力,降低开发复杂度,推动AI生态标准化发展。

百度慧播星数字人技术演进

百度慧播星作为全链路AI直播平台,通过检索增强和强化学习生成高转化脚本,利用智能中控优化直播策略,实现语音与形象克隆的“小时级”效率。平台覆盖电商、教育等多行业,日均服务2万+直播间,罗永浩数字人直播GMV突破5500万。未来,慧播星将持续迭代,提升智能化与拟真度,优化直播体验。

推荐系统三十年:从协同过滤到大模型时代的技术编年史

推荐系统30年演进史:从协同过滤到生成式AI。1992年Tapestry首创协同过滤,2006年Netflix Prize推动矩阵分解成为黄金标准,2016年深度学习全面统治,Wide&Deep、DIN等模型重塑工业架构。2023年起,大语言模型带来范式转移,生成式推荐、提示学习等新技术涌现,Meta、快手等已实现落地。技术演进始终围绕解决数据稀疏、冷启动等核心问题展开,未来将向多模态、个性化LLM方向发展。

LlamaIndex 深度实战:用《长安的荔枝》学会构建智能问答系统

本文深入探讨了RAG技术原理及LlamaIndex实战应用,通过《长安的荔枝》案例,详细解析了AI如何像人类一样“读书”。从基础概念到实战代码,再到参数优化与系统架构,全面展示了如何构建高效问答系统。此外,还介绍了如何通过AgentBay扩展RAG功能,实现多源信息整合与自动化操作。

利用LLM赋能测试用例生成

大模型技术正革新测试用例生成!传统手工编写效率低、覆盖不全,而LLM能快速解析需求,智能生成用例,覆盖正向、异常、边界等场景,确保一致性与可维护性。通过知识库构建、功能点转化、等价类划分等关键技术,实现从需求到用例的自动化流程。人机协同模式既提升效率,又保障质量,为软件测试带来全新突破。

2025必看系列:AI如何重新定义研究?万字长文讲透Deep Research

AI研究新范式Deep Research崛起!从RAG到深度研究,AI正从被动检索升级为主动探索。四大核心模块——规划、问题演化、网页探索、报告生成——让AI像专家般拆解复杂任务。主流系统虽强,但数据单一性仍是痛点。腾讯Dola创新融合公私域数据,让分析更精准。这波AI进化浪潮,正在重塑研究方式!

AICoding实践:从Prd到代码生成

AI编程系统CodeFuse正推动软件工程向"需求驱动型"变革,实现从自然语言需求到代码的端到端自动生成。面对复杂代码资产和业务理解难题,通过构建标准化Workflow、RAG检索和知识图谱增强上下文理解,结合分层生码与自动Review确保代码质量。目前安全域AI生成代码占比已达43%,在审理平台等场景实现单需求2万行代码生成,未来将持续强化技术风险防控与数据沉淀能力。

让跨境电商“懂文化”:AI内容生成在全球民族特色品类中的实践

本文提出了一套基于大模型与民族文化知识库的民族品类智能识别与匹配方案,旨在解决跨境电商平台在服务特定民族群体时的供需错配问题。通过构建民族特征知识库,结合大模型的智能匹配能力,实现了民族品类与国际站类目及商品的精准挂载。方案大幅提升了数据质量,商品挂载错误率从8.4%降至1.8%,显著优化了平台对穆斯林、印度裔等群体的服务效率。

别迷信单向量检索!医疗法律 RAG 就该用多向量列方案

多向量混合检索通过整合文本语义、关键词及多模态信息,提升复杂场景下的搜索准确度。其核心包括稀疏-稠密向量搜索和多模态向量搜索,适用于电商、医疗、法律等领域。Milvus和Zilliz Cloud提供灵活的数据结构、多样化的索引与度量方式,支持全文搜索和重排序机制,确保检索结果的精准性和稳定性。

The Evolution from RAG to Agentic RAG to Agent Memory

AI智能体的记忆机制从基础的RAG逐步演化为代理式RAG,最终引入记忆管理概念。RAG通过外部知识源增强LLM的上下文,代理式RAG则让智能体动态决定是否检索及选择工具,而记忆机制进一步允许智能体读写信息,实现个性化交互。记忆管理涉及多种类型记忆源,并需应对记忆损坏和遗忘策略等新挑战。

RAG—Chunking策略实战

分块技术是RAG系统的关键,决定了知识检索的连贯性和准确性。不当分块会导致信息断裂,影响模型推理。高质量分块需结合文档结构、语义边界和适度重叠,避免固定长度切割。策略包括基础分块、结构感知、语义主题分块及高级混合方法,需根据文本类型调整参数。优化分块能显著提升检索相关性和答案质量,是改善RAG性能的核心。

Develop an on-device RAG system powered by Gemma models

Google的EmbeddingGemma 300M模型支持在移动设备上生成文本嵌入,适用于多语言语义搜索、分类等任务。本文详细讲解了如何从PDF提取文本、分块、生成嵌入向量,并通过Gemma模型进行语义匹配和查询应答。开发者可利用IText Core库提取PDF文本,使用Deep Java Library进行分块,运行EmbeddingGemma生成向量,最后通过Gemma 3模型生成上下文相关的答案。整个过程无需依赖服务器,完全在设备端完成。

C3仓库AI代码门禁通用实践:基于Qwen3-Coder+RAG的代码评审

在C3级代码仓库中,团队通过Qwen3-Coder、RAG和Iflow实现了LLM代码评审的自动化实践。结合百炼Embedding构建知识索引,AI在CI流水线中自动触发评审,识别并发缺陷、资源泄漏等问题,显著提升评审效率与质量。AI评审已成功拦截多次高危缺陷,展现出与传统人工评审互补的优势,并在持续优化中探索修复建议生成。

RAG实践:一文掌握大模型RAG过程

RAG框架结合了信息检索与生成式大模型,突破传统限制,提升知识新鲜度与准确性。通过文档解析、数据清洗、元数据提取、内容分块、向量化等步骤,构建高效检索系统。问答阶段则包括查询预处理、数据检索、重排序、信息整合与LLM生成,确保答案精准且来源可靠。优化分块策略与混合检索方法,进一步提升系统性能与用户体验。

首页 - Wiki
Copyright © 2011-2025 iteam. Current version is 2.148.2. UTC+08:00, 2025-12-12 23:07
浙ICP备14020137号-1 $访客地图$