一直用云端 API 跑 AI 自动化任务,Token 费用每月好几百。最近试了本地大模型方案,分享体验。
本地方案的优势
- 零 API 费用 - 模型跑在自己电脑上,不用花一分钱
- 隐私安全 - 数据不出本机,不用担心泄露
- 无需 Docker - 直接安装运行,配置简单
- 离线可用 - 断网也能用
模型选择
| 模型 | 参数量 | 内存需求 | 适用场景 |
|---|---|---|---|
| Qwen3-4B | 4B | 4-6GB | 简单对话、文本处理 |
| Qwen3-35B | 35B | 24-32GB | 代码开发、复杂推理 |
| 本地 122B | 122B | 64GB+ | 接近云端 API 质量 |
实际体验
用 4B 模型跑简单的文件整理、信息摘要任务,效果还不错。但复杂任务(多步推理、代码开发)就明显不够用了,需要上更大的模型。
进阶特性
- 图数据库记忆层 - 用图结构存储对话记忆,比纯文本上下文更高效
- 树状多 Agent 调度 - 复杂任务拆解成子任务并行处理
- 动态上下文压缩 - 自动压缩过长的对话历史,节省内存
适合谁用
- 有独立显卡(至少 8GB 显存)的用户
- 对隐私有较高要求的场景
- 日常简单任务为主,不需要顶级模型能力
- 不想每月花几百块 Token 费的同学
大家有在本地跑模型的经验吗?什么配置跑什么模型比较合适?