最近在搞多 Agent 协作的项目,需要选一个性价比高的国产大模型,对比了一圈分享下结论。
需求
- 性价比要高,能完成生产级任务
- 多 Agent 高频调用,需要限制少、响应快
- 代码能力强,推理能力过关,前期设计统筹也要能做
实测结果
| 模型 | 代码能力 | 推理能力 | 价格 | 限制 |
|---|---|---|---|---|
| GLM-5 | 中等 | 少 | ||
| Kimi K2.5 | 中等 | 少 | ||
| Qwen3.5-Coder | 便宜 | 较多 | ||
| DeepSeek-V3 | 便宜 | 中等 |
结论
如果预算有限,GLM-5 和 Kimi K2.5 这两个在多 Agent 场景下表现最稳。代码质量和推理链都比较靠谱。
百炼平台的 coding plan 也值得考虑,一个套餐包含多个模型可以来回切换试错。
当然如果追求极致效果,Claude 和 GPT-4o 还是天花板,但成本确实高不少。
大家在多 Agent 场景用的什么模型?欢迎交流。