AI工程：RAG的相关资料

快手B端商业化技术探索：基于LLM构建智能RAG与Agent平台

面对大模型技术浪潮，快手围绕B端商业化进行了探索与实践。本文详细阐述了基于LLM构建Agent技术平台的策略、挑战及解决方案。

本文将带读者了解RAG技术，并以知识问答为例帮助读者快速搭建一套属于自己RAG。

本文关于如何将非结构化数据（如PDF和Word文档）转换为结构化数据，以便于RAG（Retrieval-Augmented Generation）系统使用。

阿里巴巴技术

Integrate Microsoft's GraphRAG with Neo4j, using LangChain and LlamaIndex for advanced retrieval in just a few steps. Explore detailed code examples.

简单来说，RAG（Retrieval-Augmented Generation，检索增强生成）的工作原理是将大型文档分割成多个小段落或片段。主要原因是，大语言模型的上下文窗口长度有限，无法一次处理超过上下文窗口长度的信息。

当我提出一个问题时，RAG 技术可以先从这些片段中检索相关信息，根据我提问的内容与这些片段的相似度，找出若干个与问题相关的片段，组合成一个上下文，然后将这些信息，连同我的提问一起输入到大语言模型中，然后期待大语言模型「更为精准」的回答。

本文侧重于能力总结和实操搭建部分，从大模型应用的多个原子能力实现出发，到最终串联搭建一个RAG+Agent架构的大模型应用，让个人对于大模型应用如何落地更加具有体感。

阿里巴巴技术

传统的 RAG 技术虽然能够为 LLM 提供更丰富的知识来源，但它就像一个只会“照本宣科”的学生，缺乏对知识的真正理解。而 Graph RAG 则赋予了 AI 更强大的推理能力和逻辑思维能力，让 AI 能够像人类一样理解世界、解决问题。

本文将带你走进 LLM 的世界，从入门知识到实际应用，全方位解读这个充满魔力的“大模型”。

腾讯技术

Vimeo’s video Q&A system harnesses the latest AI techniques to enable you to talk to videos about their content.

vimeo技术

Discover why GraphRAG will subsume vector-only RAG and emerge as the default RAG architecture for most use cases.

本文将通过实战代码示例，意在帮助没有大模型实战经验的Java工程师掌握使用LangChain4j框架进行大模型开发。

京东技术

本文会先介绍几篇关于RAG优化的论文，再记录一些常见的RAG工程实践经验。

阿里巴巴技术

如今，大模型已经可以从非常海量数据中搜索我们问题相关的内容，并且进行总结提炼，非常好地回答我们的问题。企业非常希望将这一技术进步应用到实际生产中，然而实践过程中我们发现仍存在着种种障碍。这就是 RAG 技术出现的原因，它可以作为一个桥梁帮助我们更好地解决搜索的问题。

RAG通常指的是"Retrieval-AugmentedGeneration"，即“检索增强的生成”。这是一种结合了检索（Retrieval）和生成（Generation）的机器学习模型，通常用于自然语言处理任务，如文本生成、问答系统等。

京东技术

RAG通过检索现有的大量知识，结合强大的生成模型，为复杂的问答、文本摘要和生成任务带来了全新的解决方案。本文详细的介绍了RAG遇到的挑战、通用范式、工程实践、优化实现策略等。

阿里巴巴技术

随着技术的快速进步，如何更高效地利用这些大模型（LLM）来解决具体问题？如何通过检索增强生成（RAG）技术提高信息的准确性和相关性？以及如何设计能够有效集成LLM、RAG和其他AI技术的智能体？

京东技术