这是一篇为您定制的 RAGFlow 部署实战教程。RAGFlow 是目前非常火爆的开源 RAG(检索增强生成)引擎,以其强大的文档解析能力著称。由于其组件较多(包含 ES、Redis、MySQL、Python 核心等),对 VPS 的性能有一定要求。RAGFlow 是基于深度文档理解的开源 RAG 引擎。与简单的 RAG 不同,它能精准识别复杂的 PDF 表格、图片和乱序文本。要在云端流畅运行 RAGFlow,Vultr 的 High Frequency (高频) 或 GPU 实例 是绝佳选择。

🛠️ 第一步:服务器选型 (至关重要)
RAGFlow 是一个“重型”应用,它内置了 Elasticsearch (或 Infinity)、MySQL、Redis 以及 OCR 引擎。不要尝试在 $5 或 $6 的机器上运行它,内存溢出会导致崩溃。
推荐配置
-
架构: Docker 容器化部署
-
方案 A (调用外部 API – 推荐): 如果您计划调用 DeepSeek、OpenAI 或 Claude 的 API,不需要本地跑大模型。
-
推荐机型: Vultr Cloud Compute (AMD or Intel High Frequency)
-
最低配置: 4 vCPU / 8GB 内存 (建议配置 4GB Swap)
-
硬盘: 至少 80GB NVMe SSD
-
-
方案 B (运行本地大模型):
-
推荐机型: Vultr GPU Cloud (NVIDIA A100 / A40 / A16)
-
配置: 显存 16GB+
-
本教程以 方案 A (4C/8G VPS + Ubuntu 24.04) 为例进行部署。
优惠参考:《2026 Vultr 最新优惠码汇总:最高免费赠送 $300 美金/充多少送多少》。
📦 第二步:系统环境初始化
SSH 登录到您的 Vultr VPS,执行以下操作更新系统并配置基础环境。
1. 更新系统
sudo apt update && sudo apt upgrade -y
2. 增加虚拟内存 (Swap) —— 防崩溃保险
8GB 内存对于 RAGFlow 的全套微服务来说比较极限,建议增加 8GB 的 Swap 防止 OOM。
# 创建 8G swap 文件
sudo fallocate -l 8G /swapfile
sudo chmod 600 /swapfile
sudo mkswap /swapfile
sudo swapon /swapfile
# 永久生效
echo '/swapfile none swap sw 0 0' | sudo tee -a /etc/fstab
3. 修改系统参数 (Elasticsearch 必须)
RAGFlow 依赖 ES/Infinity 作为向量库,必须修改 vm.max_map_count,否则容器无法启动。
echo "vm.max_map_count=262144" | sudo tee -a /etc/sysctl.conf
sudo sysctl -p
🐳 第三步:安装 Docker 全家桶
2026 年,Docker 官方脚本依然是最快的安装方式。
curl -fsSL https://get.docker.com | bash
# 启动并设置开机自启
sudo systemctl start docker
sudo systemctl enable docker
🚀 第四步:部署 RAGFlow
我们将使用官方提供的 Docker Compose 方案进行部署。
1. 克隆代码仓库
git clone https://github.com/infiniflow/ragflow.git
cd ragflow/docker
2. 选择并修改配置文件
RAGFlow 的 Docker 镜像较大,且默认会尝试拉取 HuggingFace 上的模型。
-
编辑
.env文件 (可选): 如果您想修改默认端口或版本。 -
编辑
docker-compose.yml(可选): 如果内存紧张,可以在文件中注释掉不需要的服务,但新手建议保持默认。
3. 启动服务 (耐心等待)
执行以下命令开始拉取镜像并启动。这可能需要 5-10 分钟,取决于 Vultr 到 Docker Hub 的速度。
# 指定版本号是个好习惯,或者直接用 latest
# 这里使用默认配置启动
sudo docker compose -f docker-compose.yml up -d
-
常见问题: 如果拉取镜像速度过慢或失败,请检查 VPS 的网络连接。Vultr 的新加坡和东京节点通常连接 Docker Hub 速度尚可。
4. 检查运行状态
sudo docker compose logs -f ragflow-server
当看到日志中出现类似 System initialized successfully 或 HTTP 服务启动的提示时,说明启动成功。
⚙️ 第五步:访问与模型配置
1. 登录系统
默认情况下,RAGFlow 监听 80 端口。
-
在浏览器访问:
http://<您的服务器IP> -
默认账号: 此时通常需要您注册一个新的管理员账号(具体视版本而定,新版通常首次访问引导注册)。
2. 配置 LLM (关键)
进入系统后,您还不能直接对话,因为系统需要一个“大脑”。
-
点击右上角头像 -> System Settings (系统设置)。
-
找到 Model Provider (模型提供商)。
-
添加模型:
-
建议添加 DeepSeek-V3 (性价比极高) 或 OpenAI (GPT-4o)。
-
填写您的 API Key。
-
-
设置默认模型: 确保在 Chat 设置中选择了您刚才添加的模型。
🛡️ 第六步:安全加固 (必做)
RAGFlow 默认暴露 80 端口,且没有 SSL 加密。
1. 开启 UFW 防火墙
只开放必要的端口。
sudo ufw allow 22/tcp
sudo ufw allow 80/tcp
sudo ufw allow 443/tcp
sudo ufw enable
2. 配置 Nginx 反向代理 + HTTPS
为了安全,建议不要直接暴露 Docker 端口,而是通过 Nginx 转发并加上 HTTPS。
sudo apt install nginx -y
创建一个 Nginx 配置文件 /etc/nginx/sites-available/ragflow:
server {
listen 80;
server_name rag.yourdomain.com; # 替换为您的域名
location / {
proxy_pass http://127.0.0.1:80; # 转发到 RAGFlow
proxy_set_header Host $host;
proxy_set_header X-Real-IP $remote_addr;
proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
proxy_set_header Upgrade $http_upgrade;
proxy_set_header Connection "upgrade";
}
}
启用配置并申请证书 (使用 Certbot):
sudo ln -s /etc/nginx/sites-available/ragflow /etc/nginx/sites-enabled/
sudo apt install python3-certbot-nginx -y
sudo certbot --nginx -d rag.yourdomain.com
📝 总结与维护
-
更新版本: RAGFlow 更新迭代很快。更新时,只需在
ragflow/docker目录下执行git pull,然后docker compose down和docker compose up -d。 -
资源监控: 经常使用
htop命令查看内存使用情况。如果发现 Python 进程经常被杀(Kill),说明需要升级 VPS 内存或增加 Swap。 -
数据备份: 定期备份
ragflow/docker目录下的挂载卷(volumes),这里面存储了您的知识库索引和数据库。
现在,您已经在 Vultr 上拥有了一个强大的私人企业级知识库系统!

主机百科






