Jiankun

发布于 2025-02-28 / 8 阅读

0

Ollama+DeepSeek+OPEN WebUI+RAG

#部署 #DeepSeek

Open WebUI 支持 RAG 外挂知识库的配置与使用

在 Open WebUI 中，RAG（Retrieval-Augmented Generation）外挂知识库的配置和使用需要进行一些额外的步骤。本文将详细介绍如何配置语义向量模型、创建知识库以及在实际应用中的效果展示，同时也会探讨在配置过程中可能遇到的问题及其解决方案。

1. 下载并配置语义向量模型

首先，需要下载并配置语义向量模型。在 Open WebUI 中，我们使用 bge-m3:latest 作为语义向量模型。以下是具体步骤：

下载语义向量模型：通过 ollama 工具下载 bge-m3:latest 模型。
配置语义向量模型：在管理员账户中，进入管理员面板，选择“设置” -> “文档”，然后在“语义向量模型配置”中填入 bge-m3:latest。

语义向量模型配置

2. 创建知识库并上传文档

在配置好语义向量模型后，接下来需要在工作空间中创建知识库并上传相关文档。

新建知识库：在工作空间的知识库界面中，点击“新建知识库”按钮，填写知识库的名称和描述。
上传文档：将需要使用的文档上传到新建的知识库中。

3. 使用效果对比

为了展示外挂知识库的效果，我们进行了以下对比实验：

无知识库效果：当用户提问“你知道关于XXX的专利有哪些吗？”时，系统无法提供相关信息。
外挂知识库效果：在提问前通过 # 选择知识库，然后进行同样的提问。系统能够根据知识库中的内容提供相关回答。

4. 遇到的问题及解决方案

在配置和使用过程中，我们遇到了一些问题，以下是问题及其解决方案：

PDF 图像处理问题：在 docker logs 中出现无法处理 PDF 中的图像信息的错误。
```
if not self.extract_images or "/XObject" not in page["/Resources"].keys():  # type: ignore[attr-defined]
```
解决方案：暂时在 PDF 图像处理中关闭 OCR 功能，后续考虑修改代码以支持图像处理。

评论