Advanced RAG — Using Gemini and long context for indexing rich documents (PDF, HTML...)
摘要
在处理包含文本和丰富元素(如图片、图表)的PDF文档时,结合RAG和长上下文窗口的混合方法能有效提升检索效果。首先,通过RAG技术筛选相关文档,再将其输入支持长上下文的模型(如Gemini)进行精细理解。利用多模态模型,Gemini不仅能分块文本、生成问题,还能描述图片内容。最终,结构化输出便于嵌入向量数据库,优化RAG流程。