Claude Code怎么接入Ollama本地模型？Claude Code接入Ollama本地模型方法

xiaobaiAI · 2026 年5 月 27 日 08:58

Claude Code对于token的消耗很多，那么有没有办法让他连接本地模型使用呢？答案是可以的，具体Claude Code怎么接入Ollama本地模型呢？下面就分享详细方法。

Claude Code怎么接入Ollama本地模型：

1、基础配置

启动 Claude Code 时传入环境变量：

# 方式一：单次启动
ANTHROPIC_BASE_URL=http://localhost:11434/v1 \
ANTHROPIC_API_KEY=ollama \
claude

# 方式二：写入 shell 配置文件（推荐）
echo 'export ANTHROPIC_BASE_URL=http://localhost:11434/v1' >> ~/.zshrc
echo 'export ANTHROPIC_API_KEY=ollama' >> ~/.zshrc
source ~/.zshrc
claude

2、指定本地模型

默认情况下，Claude Code 会尝试调用 claude-sonnet-4-20250514 这个模型名。对接 Ollama 时，我们需要将模型名映射到本地已拉取的模型。

Claude Code 通过 ANTHROPIC_MODEL 环境变量指定模型：

ANTHROPIC_BASE_URL=http://localhost:11434/v1 \
ANTHROPIC_API_KEY=ollama \
ANTHROPIC_MODEL=qwen2.5-coder:14b \
claude

3、验证是否成功

启动后输入一个简单测试：

> 用 JavaScript 写一个防抖函数，并说明其工作原理

如果模型正常响应，你就成功搭建了一套完全离线的 AI 编程助手。

4、踩坑实录

坑 1：流式输出兼容性 Ollama 的流式输出格式与 OpenAI 标准有细微差异。如果遇到输出卡顿，尝试关闭流式模式：

# Claude Code 暂未暴露 stream 配置，但 Ollama 0.3.0+ 已修复此问题
# 升级到最新版即可
ollama --version   # 确认 ≥ 0.3.0

坑 2：上下文窗口不足 本地模型受限于显存，上下文窗口通常较小（4K-32K tokens）。而 Claude Code 默认会发送大量上下文（包括项目文件）。可以通过限制 --max-tokens 或减少发送给模型的文件数量来规避：

# 在 Claude Code 中压缩历史对话
> /compact

坑 3：模型名不匹配报错 Claude Code 内部写死了默认模型名，如果 Ollama 没有对应模型会返回 404。确保环境变量 ANTHROPIC_MODEL 与 ollama list 中的模型名完全一致。

上述就是Claude Code怎么接入Ollama本地模型的方法，希望对大家使用Claude Code提供了帮助，如果想要了解其他用法，欢迎来CoCoLoop社区交流。

Sunshine · 2026 年5 月 27 日 11:38

本地模型就吃自身电脑配置了