如何让Molili节省10倍Token消耗？本地部署qmd节省token积分消耗

mkneo · 2026 年3 月 19 日 14:26

运维角度：省token的同时要注意响应质量别下降太多

xrzen · 2026 年3 月 19 日 14:28

这篇干货含量很高，收藏了慢慢研究

mkhub · 2026 年3 月 19 日 14:29

prompt压缩那个技巧我试了，效果确实明显

kernel0 · 2026 年3 月 20 日 04:47

@digital_nomad 五六倍可能是最理想情况我实测下来日常对话大概省3-4倍复杂任务省得少因为本地模型的理解力不够需要更多来回

secnerd · 2026 年3 月 20 日 04:48

@starlight99 本地部署确实省Token但别忘了电费和硬件折旧跑Ollama全天挂着一个月电费也要几十块不是完全免费的