AI工程:RAG
快手B端商业化技术探索:基于LLM构建智能RAG与Agent平台
面对大模型技术浪潮,快手围绕B端商业化进行了探索与实践。本文详细阐述了基于LLM构建Agent技术平台的策略、挑战及解决方案。
半天玩转大模型技术之RAG
本文将带读者了解RAG技术,并以知识问答为例帮助读者快速搭建一套属于自己RAG。
RAG效果优化:高质量文档解析详解
本文关于如何将非结构化数据(如PDF和Word文档)转换为结构化数据,以便于RAG(Retrieval-Augmented Generation)系统使用。
Integrating Microsoft GraphRAG into Neo4j
Integrate Microsoft's GraphRAG with Neo4j, using LangChain and LlamaIndex for advanced retrieval in just a few steps. Explore detailed code examples.
GraphRAG + GPT-4o mini 低成本构建 AI 图谱知识库
简单来说,RAG(Retrieval-Augmented Generation,检索增强生成) 的工作原理是将大型文档分割成多个小段落或片段。主要原因是,大语言模型的上下文窗口长度有限,无法一次处理超过上下文窗口长度的信息。
当我提出一个问题时,RAG 技术可以先从这些片段中检索相关信息,根据我提问的内容与这些片段的相似度,找出若干个与问题相关的片段,组合成一个上下文,然后将这些信息,连同我的提问一起输入到大语言模型中,然后期待大语言模型「更为精准」的回答。
如何速成RAG+Agent框架大模型应用搭建
本文侧重于能力总结和实操搭建部分,从大模型应用的多个原子能力实现出发,到最终串联搭建一个RAG+Agent架构的大模型应用,让个人对于大模型应用如何落地更加具有体感。
从“一本正经地胡说八道”到“更懂你”:Graph RAG 如何让 AI 真正拥有知识?
传统的 RAG 技术虽然能够为 LLM 提供更丰富的知识来源,但它就像一个只会“照本宣科”的学生,缺乏对知识的真正理解。而 Graph RAG 则赋予了 AI 更强大的推理能力和逻辑思维能力,让 AI 能够像人类一样理解世界、解决问题。
一文搞懂大模型!基础知识、 LLM 应用、 RAG 、 Agent 与未来发展
本文将带你走进 LLM 的世界,从入门知识到实际应用,全方位解读这个充满魔力的“大模型”。
Unlocking knowledge sharing for videos with RAG
Vimeo’s video Q&A system harnesses the latest AI techniques to enable you to talk to videos about their content.
The GraphRAG Manifesto: Adding Knowledge to GenAI
Discover why GraphRAG will subsume vector-only RAG and emerge as the default RAG architecture for most use cases.
Java开发者LLM实战——使用LangChain4j构建本地RAG系统
本文将通过实战代码示例,意在帮助没有大模型实战经验的Java工程师掌握使用LangChain4j框架进行大模型开发。
一文梳理有效提升RAG效果的方法
本文会先介绍几篇关于RAG优化的论文,再记录一些常见的RAG工程实践经验。
RAG 标准和腾讯云 ES 的技术实践
如今,大模型已经可以从非常海量数据中搜索我们问题相关的内容,并且进行总结提炼,非常好地回答我们的问题。企业非常希望将这一技术进步应用到实际生产中,然而实践过程中我们发现仍存在着种种障碍。这就是 RAG 技术出现的原因,它可以作为一个桥梁帮助我们更好地解决搜索的问题。
如何手撸一个自有知识库的RAG系统
RAG通常指的是"Retrieval-AugmentedGeneration",即“检索增强的生成”。这是一种结合了检索(Retrieval)和生成(Generation)的机器学习模型,通常用于自然语言处理任务,如文本生成、问答系统等。
一文详谈RAG优化方案与实践
RAG通过检索现有的大量知识,结合强大的生成模型,为复杂的问答、文本摘要和生成任务带来了全新的解决方案。本文详细的介绍了RAG遇到的挑战、通用范式、工程实践、优化实现策略等。
面向AI的开发:从大模型(LLM)、检索增强生成(RAG)到智能体(Agent)的应用
随着技术的快速进步,如何更高效地利用这些大模型(LLM)来解决具体问题?如何通过检索增强生成(RAG)技术提高信息的准确性和相关性?以及如何设计能够有效集成LLM、RAG和其他AI技术的智能体?