Claude Code怎么接入Ollama本地模型?Claude Code接入Ollama本地模型方法

Claude Code对于token的消耗很多,那么有没有办法让他连接本地模型使用呢?答案是可以的,具体Claude Code怎么接入Ollama本地模型呢?下面就分享详细方法。

Claude Code怎么接入Ollama本地模型:

1、基础配置

启动 Claude Code 时传入环境变量:

# 方式一:单次启动
ANTHROPIC_BASE_URL=http://localhost:11434/v1 \
ANTHROPIC_API_KEY=ollama \
claude
# 方式二:写入 shell 配置文件(推荐)
echo 'export ANTHROPIC_BASE_URL=http://localhost:11434/v1' >> ~/.zshrc
echo 'export ANTHROPIC_API_KEY=ollama' >> ~/.zshrc
source ~/.zshrc
claude

2、指定本地模型

默认情况下,Claude Code 会尝试调用 claude-sonnet-4-20250514 这个模型名。对接 Ollama 时,我们需要将模型名映射到本地已拉取的模型。

Claude Code 通过 ANTHROPIC_MODEL 环境变量指定模型:

ANTHROPIC_BASE_URL=http://localhost:11434/v1 \
ANTHROPIC_API_KEY=ollama \
ANTHROPIC_MODEL=qwen2.5-coder:14b \
claude

3、验证是否成功

启动后输入一个简单测试:

> 用 JavaScript 写一个防抖函数,并说明其工作原理

如果模型正常响应,你就成功搭建了一套完全离线的 AI 编程助手

4、踩坑实录

坑 1:流式输出兼容性 Ollama 的流式输出格式与 OpenAI 标准有细微差异。如果遇到输出卡顿,尝试关闭流式模式:

# Claude Code 暂未暴露 stream 配置,但 Ollama 0.3.0+ 已修复此问题
# 升级到最新版即可
ollama --version   # 确认 ≥ 0.3.0

坑 2:上下文窗口不足 本地模型受限于显存,上下文窗口通常较小(4K-32K tokens)。而 Claude Code 默认会发送大量上下文(包括项目文件)。可以通过限制 --max-tokens 或减少发送给模型的文件数量来规避:

# 在 Claude Code 中压缩历史对话
> /compact

坑 3:模型名不匹配报错 Claude Code 内部写死了默认模型名,如果 Ollama 没有对应模型会返回 404。确保环境变量 ANTHROPIC_MODELollama list 中的模型名完全一致。

上述就是Claude Code怎么接入Ollama本地模型的方法,希望对大家使用Claude Code提供了帮助,如果想要了解其他用法,欢迎来CoCoLoop社区交流。

本地模型就吃自身电脑配置了