Claude Code对于token的消耗很多,那么有没有办法让他连接本地模型使用呢?答案是可以的,具体Claude Code怎么接入Ollama本地模型呢?下面就分享详细方法。
Claude Code怎么接入Ollama本地模型:
1、基础配置
启动 Claude Code 时传入环境变量:
# 方式一:单次启动
ANTHROPIC_BASE_URL=http://localhost:11434/v1 \
ANTHROPIC_API_KEY=ollama \
claude
# 方式二:写入 shell 配置文件(推荐)
echo 'export ANTHROPIC_BASE_URL=http://localhost:11434/v1' >> ~/.zshrc
echo 'export ANTHROPIC_API_KEY=ollama' >> ~/.zshrc
source ~/.zshrc
claude
2、指定本地模型
默认情况下,Claude Code 会尝试调用 claude-sonnet-4-20250514 这个模型名。对接 Ollama 时,我们需要将模型名映射到本地已拉取的模型。
Claude Code 通过 ANTHROPIC_MODEL 环境变量指定模型:
ANTHROPIC_BASE_URL=http://localhost:11434/v1 \
ANTHROPIC_API_KEY=ollama \
ANTHROPIC_MODEL=qwen2.5-coder:14b \
claude
3、验证是否成功
启动后输入一个简单测试:
> 用 JavaScript 写一个防抖函数,并说明其工作原理
如果模型正常响应,你就成功搭建了一套完全离线的 AI 编程助手。
4、踩坑实录
坑 1:流式输出兼容性 Ollama 的流式输出格式与 OpenAI 标准有细微差异。如果遇到输出卡顿,尝试关闭流式模式:
# Claude Code 暂未暴露 stream 配置,但 Ollama 0.3.0+ 已修复此问题
# 升级到最新版即可
ollama --version # 确认 ≥ 0.3.0
坑 2:上下文窗口不足 本地模型受限于显存,上下文窗口通常较小(4K-32K tokens)。而 Claude Code 默认会发送大量上下文(包括项目文件)。可以通过限制 --max-tokens 或减少发送给模型的文件数量来规避:
# 在 Claude Code 中压缩历史对话
> /compact
坑 3:模型名不匹配报错 Claude Code 内部写死了默认模型名,如果 Ollama 没有对应模型会返回 404。确保环境变量 ANTHROPIC_MODEL 与 ollama list 中的模型名完全一致。
上述就是Claude Code怎么接入Ollama本地模型的方法,希望对大家使用Claude Code提供了帮助,如果想要了解其他用法,欢迎来CoCoLoop社区交流。
