货拉拉 RAG 优化实践:从原始数据到高质量知识库

摘要

知识库构建依赖人工外呼与迁移通用知识,初始包含相似问法、意图和标准话术。线上使用时,三者映射准确性影响LLM生成话术的合理性。常见问题包括意图名定义不清、相似问法与话术不匹配、意图过于概括等。清洗知识库可基于嵌入模型聚类或大模型语义理解,后者更优。通过优化意图名、重新归类相似问法、细分意图和生成多样化话术,提升知识库准确性。未来可探索自动提示词优化和相似问法拆分。

欢迎在评论区写下你对这篇文章的看法。

评论

Home - Wiki
Copyright © 2011-2025 iteam. Current version is 2.148.2. UTC+08:00, 2025-12-12 08:17
浙ICP备14020137号-1 $Map of visitor$