Open WebUI 支持 RAG 外挂知识库的配置与使用
在 Open WebUI 中,RAG(Retrieval-Augmented Generation)外挂知识库的配置和使用需要进行一些额外的步骤。本文将详细介绍如何配置语义向量模型、创建知识库以及在实际应用中的效果展示,同时也会探讨在配置过程中可能遇到的问题及其解决方案。
1. 下载并配置语义向量模型
首先,需要下载并配置语义向量模型。在 Open WebUI 中,我们使用 bge-m3:latest 作为语义向量模型。以下是具体步骤:
- 下载语义向量模型:通过
ollama工具下载bge-m3:latest模型。 - 配置语义向量模型:在管理员账户中,进入管理员面板,选择“设置” -> “文档”,然后在“语义向量模型配置”中填入
bge-m3:latest。

2. 创建知识库并上传文档
在配置好语义向量模型后,接下来需要在工作空间中创建知识库并上传相关文档。
- 新建知识库:在工作空间的知识库界面中,点击“新建知识库”按钮,填写知识库的名称和描述。
- 上传文档:将需要使用的文档上传到新建的知识库中。
3. 使用效果对比
为了展示外挂知识库的效果,我们进行了以下对比实验:
-
无知识库效果:当用户提问“你知道关于XXX的专利有哪些吗?”时,系统无法提供相关信息。

-
外挂知识库效果:在提问前通过
#选择知识库,然后进行同样的提问。系统能够根据知识库中的内容提供相关回答。

4. 遇到的问题及解决方案
在配置和使用过程中,我们遇到了一些问题,以下是问题及其解决方案:
-
PDF 图像处理问题:在
docker logs中出现无法处理 PDF 中的图像信息的错误。if not self.extract_images or "/XObject" not in page["/Resources"].keys(): # type: ignore[attr-defined]解决方案:暂时在 PDF 图像处理中关闭 OCR 功能,后续考虑修改代码以支持图像处理。