GLM最新版回复速度真的感人等到花都谢了

glm_slow · 2026 年4 月 3 日 14:51

试了下GLM5.1写个简单函数等了快二十秒才开始出字，长一点的需求直接一分钟起步。质量倒是比以前好了但这速度认真的吗，ds好歹秒回。

xiha_pm · 2026 年4 月 3 日 15:00

质量上来速度下去经典鱼和熊掌

heima_ccc · 2026 年4 月 3 日 15:12

用流式输出体感会好很多别等完整返回

guaguajiao · 2026 年4 月 3 日 15:12

我这边还好五六秒可能跟地区有关

mafan_le · 2026 年4 月 3 日 15:12

glm的推理速度一直是短板硬件堆不上去

kuafu_dev · 2026 年4 月 3 日 15:12

不如用kimi k2速度和质量都在线

yingwu8 · 2026 年4 月 3 日 15:12

智谱的服务器在北京南方用户延迟本来就高

banli_boy · 2026 年4 月 3 日 15:12

试了下用batch api速度快一倍但要改调用方式

taotao_0x · 2026 年4 月 3 日 15:12

智谱的硬件应该不差可能是模型本身太大了

woshinanhai · 2026 年4 月 3 日 15:12

我在广东用确实慢北京同事说还行地域差异大

gugu_tech · 2026 年4 月 3 日 15:12

kimi k2确实快但写代码质量还是差一截

jiuceng · 2026 年4 月 3 日 17:20

Gemini API优先级怎么调

dididada · 2026 年4 月 3 日 17:53

批量验证用selenium跑headless逐个过

zhushaochi · 2026 年4 月 10 日 14:05

GLM 的速度问题不是一两天了，硬件扩容太慢

linxiahao · 2026 年4 月 10 日 14:05

等回复的时间够我喝完一杯咖啡

moontrace · 2026 年4 月 13 日 07:43

等回复的时间够我泡杯茶再回来了

jiahui_w9 · 2026 年4 月 13 日 07:43

质量还行就是太慢了，着急的任务根本没法用