Jiankun
发布于 2025-02-28 / 8 阅读
0
0

Ollama+DeepSeek+OPEN WebUI+RAG

Open WebUI 支持 RAG 外挂知识库的配置与使用

在 Open WebUI 中,RAG(Retrieval-Augmented Generation)外挂知识库的配置和使用需要进行一些额外的步骤。本文将详细介绍如何配置语义向量模型、创建知识库以及在实际应用中的效果展示,同时也会探讨在配置过程中可能遇到的问题及其解决方案。

1. 下载并配置语义向量模型

首先,需要下载并配置语义向量模型。在 Open WebUI 中,我们使用 bge-m3:latest 作为语义向量模型。以下是具体步骤:

  1. 下载语义向量模型:通过 ollama 工具下载 bge-m3:latest 模型。
  2. 配置语义向量模型:在管理员账户中,进入管理员面板,选择“设置” -> “文档”,然后在“语义向量模型配置”中填入 bge-m3:latest

语义向量模型配置

2. 创建知识库并上传文档

在配置好语义向量模型后,接下来需要在工作空间中创建知识库并上传相关文档。

  1. 新建知识库:在工作空间的知识库界面中,点击“新建知识库”按钮,填写知识库的名称和描述。
  2. 上传文档:将需要使用的文档上传到新建的知识库中。

3. 使用效果对比

为了展示外挂知识库的效果,我们进行了以下对比实验:

  • 无知识库效果:当用户提问“你知道关于XXX的专利有哪些吗?”时,系统无法提供相关信息。

    无知识库效果

  • 外挂知识库效果:在提问前通过 # 选择知识库,然后进行同样的提问。系统能够根据知识库中的内容提供相关回答。

    选择知识库

    外挂知识库效果

4. 遇到的问题及解决方案

在配置和使用过程中,我们遇到了一些问题,以下是问题及其解决方案:

  1. PDF 图像处理问题:在 docker logs 中出现无法处理 PDF 中的图像信息的错误。

    if not self.extract_images or "/XObject" not in page["/Resources"].keys():  # type: ignore[attr-defined]
    

    解决方案:暂时在 PDF 图像处理中关闭 OCR 功能,后续考虑修改代码以支持图像处理。


评论