给你的 AI 助手装上本地知识库大脑：RAGFlow 部署与 OpenClaw 集成指南

Question

一、为什么需要强大的本地知识库？

通用 LLM 训练于公开数据，它知道什么是「年假」，但不知道你们公司年假是 5 天还是 15 天。它知道「润滑脂」是工业润滑剂，但不知道你们仓库里用的是 NLGI 2 号还是 3 号。

这就是 RAG（检索增强生成）要解决的问题——在 AI 回答问题之前，先让它到你的私有知识库里翻一遍资料，翻到了再回答。

先搞清需求层级：你属于哪种？

在 OpenClaw 生态里，知识管理其实有多个层次，适用于不同场景：

方案	适合场景	重量级	最大文档量
OpenClaw MEMORY.md	个人日常：聊天记录、偏好、简短备忘	🟢 极轻	几十条
Obsidian 等本地知识库	个人笔记、项目管理、写作素材	🟡 较轻	几百篇
RAGFlow 专业 RAG 引擎 🎯	专业学者、小型/大型团队：行业报告、技术文档、制度手册、图纸说明等数千份材料	🔴 较重（约 8-16GB 内存）	数千份稳定可靠

三种方案不是替代关系，而是互补。MEMORY.md 管日常对话记忆，Obsidian 管个人笔记，而本文要讲的 RAGFlow 解决的是「海量文档级知识库」——你的文档不是几十篇笔记，而是几百上千份 PDF、制度文件、技术手册、行业报告，需要一个专业引擎来管理。

为什么一定要本地部署？

对比	本地知识库	云知识库服务
隐私安全	✅ 全部数据在自己电脑上	❌ 公司制度、技术文档要上传别人服务器
断网可用	✅ 局域网内随时随地	❌ 没网就废了
长期成本	✅ 一次性硬件投入	❌ 按存储+调用量持续收费
数据主权	✅ 随时删、随时改、自己说了算	❌ 受平台条款约束

对于数千份文档规模的场景，云服务不仅贵，数据安全也是大问题。本地部署是唯一合理的方案。

目前最成熟的开源方案组合，就是 RAGFlow + OpenClaw。

二、正常安装 RAGFlow 的流程（简短表述）

安装 RAGFlow 本身不算难，但步骤多且杂。如果你从零开始手动部署，大概要做这些事：

1. 环境准备
   → 开启 BIOS 虚拟化（VT-x/AMD-V，大部分电脑默认已开，可跳过）
   → 管理员 PowerShell 运行 wsl --install，自动安装 WSL2 和 Ubuntu
   → 重启电脑

2. 安装 Docker Desktop
   → 去官网下载安装
   → Settings → Resources → WSL Integration 确认 Ubuntu 已启用
   → 启动 Docker，等待右下角鲸鱼图标亮起

3. 部署 RAGFlow 容器
   → git clone 仓库 → cd docker → docker compose up -d
   → 等 5-10 分钟下载镜像和初始化

4. 登录 RAGFlow Web 界面
   → 浏览器打开 http://localhost:9222
   → 注册管理员账号

5. 生成 API Key
   → 在 Web 界面里点「设置」→「API Keys」→ 创建新 Key
   → 复制出来保存好

6. 配置模型
   → Embedding 模型（向量化）
   → Chat 模型（对话）
   → Rerank 模型（重排序）
   → 每个都要手动添加和激活

7. 创建知识库、上传文档、启动解析
   → 在 Web 界面操作，一步步点

8. 拿到 API Key 后，再配置到 OpenClaw 技能里
   → 安装官方 Skill → 配置 .env → 才能开始用

全部做完，快的话 20 分钟，慢的话一个小时起步。中间还可能遇到各种报错——端口冲突、镜像拉取失败、容器启动失败、嵌入模型配置报错……每一个都够新手卡半天。

而且这些步骤没有任何一个是可以跳过的。缺了任何一步，OpenClaw 都没法和 RAGFlow 连上。

三、嫌麻烦的话，可以用 ragflow-workbench 技能

Openclaw如此强大，为什么不让Openclaw帮我安装？

因此我把上述所有手动步骤让Openclaw帮我一步步执行完成，并封装成一个 OpenClaw 技能——ragflow-workbench

1. 安装技能

此skill我已经上传到SkillHub中，可以复制此文本让Openclaw自己安装：

请先检查是否已安装 SkillHub 商店，若未安装，请根据 https://skillhub.cn/install/skillhub.md 安装Skillhub商店，但是只安装CLI，然后安装ragflow-workbench技能。

若已安装，则直接安装ragflow-workbench技能。

安装后，在 OpenClaw 配置中启用该技能，你就可以直接在聊天框里和它对话了。

2. 当你在 OpenClaw 里说「我想加个知识库」时

不再需要你去看教程、翻文档、记 API。OpenClaw 会主动和你对话：

你：我想给我的 AI 加一个本地知识库

OpenClaw： ❓ 您是否还没有下载安装 RAGFlow？需要我帮您下载安装吗？
或者您已经部署了 RAGFlow？请告诉我地址和账号密码（或 API Key），
我帮您自动测试连接。

然后根据你的回答，走对应的路径：

路径 A：全新安装（你选「帮我装一个」）

OpenClaw 一步步引导你：

**「先检查一下虚拟化是否开启（大部分电脑默认已开，不用纠结）。」

**「然后用管理员身份打开 PowerShell，运行 wsl --install 安装 WSL 和 Ubuntu。」
**「装好后去 https://www.docker.com/products/docker-desktop/ 下载安装 Docker Desktop。」

「启动 Docker Desktop，在 Settings → Resources → WSL Integration 里确认 Ubuntu 已启用。」
「一切就绪后，在终端执行：」
git clone https://github.com/infiniflow/ragflow.git
cd ragflow/docker
docker compose up -d
「等 5-10 分钟让 RAGFlow 初始化，好了告诉我，我来检查环境。」

你告诉它「好了」，剩下的事情脚本自动完成：

▶ scripts/check_windows_install.py
    自动检查：Docker 运行 ✅ 容器启动 ✅ API 端口通 ✅ Web 端口通 ✅

▶ scripts/bootstrap_admin.py
    容器内加密密码 → 注册管理员 → 登录获取 Token → 创建 API Key
    → 自动写入 .env 文件 ✅ （你不需要碰 Web 界面）

▶ scripts/configure_default_models.py
    自动配置 Embedding 模型（bge-m3）
    自动配置 Chat 模型（qwen2-7b-instruct）
    自动配置 Rerank 模型（bge-reranker-v2-m3） ✅

OpenClaw： ✅ 全部就绪！现在你可以上传文档到知识库了。

配置RagFlow模型：技能支持自动配置牧马人 Herdsman 推理引擎中的本地模型

装好 RAGFlow 之后还需要配模型才能用——Embedding 模型负责把文档转成向量，Chat 模型负责回答问题，Rerank 模型负责优化检索排序。

正常情况下你得去 RAGFlow Web 界面一个个手动添加模型供应商、输入 API 地址、测试连接。但如果用云端模型还要额外申请 API Key 和付费，对小白来说又是一道坎。

ragflow-workbench 的解决办法：技能内置了自动调用牧马人 Herdsman 模型推理引擎的本地模型进行配置，自动调用本机提供的本地模型算力。

牧马人 Herdsman 是一个本地模型推理引擎，支持在普通电脑上运行 Embedding、Chat、Rerank 模型，无需 GPU、无需联网、无需申请云 API。详情与下载安装链接：FlowyAIPC-牧马人本地推理引擎

安装引导完成后，脚本会自动执行：

▶ scripts/configure_default_models.py
    自动启动 Herdsman 本地推理引擎
    配置 Embedding 模型（bge-m3）——向量化你的文档
    配置 Chat 模型（qwen2-7b-instruct）——回答你的问题
    配置 Rerank 模型（bge-reranker-v2-m3）——优化检索排序
    全部对接本地 Herdsman 服务，不依赖任何云端 API  ✅

这意味着什么？

✅ 不用去申请 OpenAI / DeepSeek / 通义千问的 API Key
✅ 不用配置外部模型供应商地址
✅ 所有模型跑在本机，不联网也能用
✅ 不产生任何 API 调用费用

如果你自己已经部署了其他模型服务（比如 Ollama、vLLM），也可以在配置时指定地址：

uv run python scripts/configure_default_models.py ^
  --api-base http://host.docker.internal:8080/v1 ^
  --chat-model deepseek-chat ^
  --json

路径 B：已有 RAGFlow，给地址和密码

你：我已经部署了，地址 192.168.1.100，账号 admin@xxx.com，密码 xxxx

脚本自动测试连接 → 登录 → 创建 API Key → 写入 .env。
不用自己去 Web 界面翻设置页。

路径 C：已经有 API Key

你：这是我的 API Key：xxxxxxxx

直接测试有效性 → 有效就写入 .env → 跳过所有引导步骤。

一次搞定，以后不用再管

.env 写入后，后续所有 OpenClaw 会话自动跳过引导流程。不会每次都被问「你要不要装 RAGFlow」。

之后就是正常使用了。

五、日常怎么用：用白话指挥你的知识库

装好之后，你和 OpenClaw 的对话不再只是聊天——你的每一句指令都可能牵动知识库的增删改查。来看看最常见的几种场景：

场景 1：单文件入库

你：帮我把这份员工手册 PDF 添加到知识库
OpenClaw： 收到，正在上传 C:\文档\员工手册.pdf 到知识库「公司制度」……
OpenClaw： ✅ 上传完成（1.2MB），正在解析，预计 10 秒后可用。
（来源：员工手册.pdf · 正在解析中，进度 42%）

你想加任何一个文件，直接告诉 OpenClaw 文件路径和放哪个知识库就行。不需要打开 RAGFlow 的 Web 界面。

场景 2：批量文件夹入库

你：把这个「行业报告」文件夹里所有 PDF 都上传到知识库
OpenClaw： 正在扫描 C:\行业报告\ 目录，找到 23 个 PDF 文件……
OpenClaw： 创建新知识库「行业报告」→ 批量上传中（共 23 个文件）……
OpenClaw： ✅ 23 个文件全部上传完成，正在排队解析，完成后我会通知您。
OpenClaw（10 分钟后）： 解析完成，23/23 成功。知识库「行业报告」现可查询。

不用一个个手动操作。文件夹拖进去，剩下的 OpenClaw 处理。

场景 3：基于知识库回答问题

这是最核心的日常场景。你问的问题，AI 会自动去知识库里检索，找到相关文档片段，基于这些片段回答：

你：入职满一年年假几天？
AI： 根据《员工手册》第四章第2条，入职满一年享5天年假。
（来源：员工手册.pdf · 第12页）

你：我们公司调休怎么规定的？
AI： 调休只适用于休息日加班，工作日和法定节假日不予调休。
（来源：考勤制度.docx · 第8条）

你：对比前两年的行业报告，说说市场趋势变化
AI： 检索到 2024 和 2025 年行业报告共 6 篇，关键趋势变化如下：
1. 2024年重点在 A（来源：2024行业报告.pdf）
2. 2025年转向 B（来源：2025行业趋势分析.docx）

每个回答都标注了引用来源，你可以追溯到原文。

场景 4：基于知识库整理信息、撰写文章

RAGFlow 不止能回答具体问题——你还可以让它基于知识库的内容，帮你归纳、提炼、成文：

你：把知识库里关于「高温润滑脂」的所有资料整理成一篇技术说明文
AI： 我在知识库中检索到 12 篇相关文档，涵盖产品规格书、技术手册和质检报告。以下是整理后的技术说明：
   —（正文）—
   本文基于以下参考资料撰写：
   • 润滑脂选型指南（第3章 · 高温应用）
   • NLGI 分级标准说明书
   • 2025 年高温润滑脂质检报告

你：汇总一下知识库里所有和「安全生产」有关的条款，分 risk level 整理成表格
AI： 已检索到 5 份相关制度文件，共提取 21 条安全生产条款：
   | risk level | 条款数 | 主要来源 |
   |------------|--------|----------|
   | 🔴 高危 | 3 | 安全生产管理制度.pdf |
   | 🟡 中危 | 8 | 同上 + 应急预案.docx |
   | 🟢 低危 | 10 | 员工安全手册.pdf |

如果是写报告、做培训材料、整理信息汇总的场景，直接让 OpenClaw 基于知识库帮你写，结果有据可查。

场景 5：跨知识库查询与综合

如果你的知识库按主题分得很细（比如「公司制度」「产品资料」「行业报告」），可以同时查多个：

你：查一下我们公司的产品在行业标准中的定位
AI： 已检索知识库「产品资料」（8 篇）和「行业报告」（5 篇），发现：
   • 产品 A 符合 GB/T XXXX 标准（来源：产品规格书.pdf）
   • 行业最新标准在 2025 年已更新至 YYYY 版本（来源：行业报告_2025.docx）
   • 建议升级产品 B 以符合新版标准（来源：技术评审会议纪要.pdf）

以上所有操作，全程只需要你在 OpenClaw 聊天框里说一句话。 不用打开 RAGFlow Web 界面，不用查 API 文档，不用写代码。

地震资料知识库案例截图.png