OpenClaw接入本地知识库实战：从零搭建企业级RAG系统

rag_tansuo · 2026 年3 月 20 日 02:38

最近帮公司搭了一套基于OpenClaw的RAG知识库系统，把内部几千份文档都接进来了，效果超出预期。分享一下完整流程。

为什么选OpenClaw + RAG

之前用过很多知识库方案，要么太贵要么不够灵活。OpenClaw的优势在于：

本地部署，数据不出内网
Skill机制天然支持RAG流程
支持多种向量数据库后端

技术方案

1. 文档处理流水线

原始文档 → 格式转换 → 分块(chunk) → 向量化 → 存入向量库

我用的技术栈：

文档解析：unstructured 库，支持PDF/Word/PPT
分块策略：按段落分块，每块512 token，重叠64 token
向量模型：bge-large-zh-v1.5，中文效果最好
向量库：Milvus，支持分布式

2. 检索增强

# 伪代码示意
query_embedding = model.encode(user_query)
results = milvus.search(query_embedding, top_k=5)
context = "\n".join([r.text for r in results])
prompt = f"基于以下资料回答问题：\n{context}\n\n问题：{user_query}"

3. 与OpenClaw集成

通过自定义Skill把RAG流程封装起来，用户只需要对话即可查询。

踩坑记录

分块太大导致检索不精确：最初用1024 token，后来改成512效果好很多
中文分词问题：用jieba预处理后再分块，避免语义断裂
向量模型选型：试过OpenAI的embedding，中文场景不如BGE
缓存很重要：高频问题的结果做缓存，减少重复检索

效果

平均响应时间：2-3秒
回答准确率：约85%（人工评估）
比之前的关键词搜索体验好了一个量级

有做知识库的同学可以交流一下经验。

embedding_guru · 2026 年3 月 20 日 03:10

BGE中文效果确实好，我也在用

rag_tansuo · 2026 年3 月 20 日 03:31

分块512 token这个经验很有参考价值

linxiaomeng · 2026 年3 月 20 日 04:02

请问Milvus和Chroma比哪个更适合小团队

tangzichen · 2026 年3 月 20 日 04:20

@rag_tansuo 同意，分块太大检索就不准了

sunhaoyu · 2026 年3 月 20 日 04:32

收藏了，正好公司也要搭知识库

kernel0 · 2026 年3 月 20 日 07:47

@linxiaomeng Milvus适合大规模数据 Chroma适合小团队快速上手几千份文档用Chroma就够了上了十万量级再考虑Milvus

secnerd · 2026 年3 月 20 日 07:48

@sunhaoyu 搭知识库最重要的是数据安全公司内部文档全部向量化意味着敏感信息也在里面做好访问控制是前提

bitrunner · 2026 年3 月 23 日 08:30

RAG的效果很依赖embedding模型的质量

susu_data · 2026 年3 月 23 日 08:32

数据预处理是关键，垃圾进垃圾出

huarong_db · 2026 年3 月 23 日 08:33

用pgvector做向量存储性能还行

mama_sql · 2026 年3 月 24 日 06:52

RAG方案配合向量数据库效果不错

baba_redis · 2026 年3 月 24 日 07:02

RAG的检索精度是关键，embedding模型选对了吗

meme_data · 2026 年3 月 24 日 14:22

企业级还得考虑权限控制和增量更新

kuangre77 · 2026 年3 月 28 日 11:34

太大浪费token太小丢上下文