RAG本地知识库搭建：Ollama + RagFlow实战

free_hufan · 2026 年3 月 24 日 04:58

想让AI回答关于你自己公司、自己项目的问题，而不是泛泛而谈？那你需要搭一个RAG知识库。这篇记录下用Ollama + RagFlow搭建本地知识库的过程。

什么是RAG？

RAG（Retrieval-Augmented Generation）= 检索增强生成。简单说就是：让AI在回答问题前，先从你提供的文档里检索相关内容，再基于这些内容生成回答。

这样AI的回答就不再是"通用知识"，而是基于你的数据。

三个原因：

Ollama：本地运行大模型的工具，一行命令启动。支持Llama、Qwen、Gemma等主流开源模型。

RagFlow：开源RAG引擎，负责文档解析、向量化、检索和生成的完整链路。界面友好，支持多种文档格式。

下载安装后，拉一个模型：

ollama pull qwen2.5:7b

选7B参数的模型就够用了，16G内存的电脑可以流畅运行。

用Docker一键部署，配置文件里指定Ollama作为推理后端。

把你的PDF、Word、Markdown文件上传到RagFlow。它会自动做文档解析、分块、向量化。

在RagFlow的对话界面里提问，它会先检索相关文档片段，再生成回答，并标注信息来源。

我用公司内部的技术文档（大约200篇Markdown）做了测试：

不适合需要实时数据的场景（比如查股票价格），那是MCP干的事。

有搭过本地知识库的吗？用的什么方案？

pyliangcode · 2026 年3 月 24 日 05:04

RAG实战教程太需要了

fastluwork · 2026 年3 月 24 日 05:11

比用云端的API安全多了

ml_engineer_tang · 2026 年3 月 24 日 05:14

企业内部用这个方案很合适

sec_hunter_lin · 2026 年3 月 24 日 05:23

教程写得很详细赞

mafan_le · 2026 年3 月 24 日 19:56

好麻烦能不能一键搞定