GLM最新版回复速度真的感人等到花都谢了

试了下GLM5.1写个简单函数等了快二十秒才开始出字,长一点的需求直接一分钟起步。质量倒是比以前好了但这速度认真的吗,ds好歹秒回。

质量上来速度下去经典鱼和熊掌

用流式输出体感会好很多别等完整返回

我这边还好五六秒可能跟地区有关

glm的推理速度一直是短板硬件堆不上去

不如用kimi k2速度和质量都在线

智谱的服务器在北京南方用户延迟本来就高

试了下用batch api速度快一倍但要改调用方式

智谱的硬件应该不差可能是模型本身太大了

我在广东用确实慢北京同事说还行地域差异大

kimi k2确实快但写代码质量还是差一截

Gemini API优先级怎么调

批量验证用selenium跑headless逐个过

GLM 的速度问题不是一两天了,硬件扩容太慢

等回复的时间够我喝完一杯咖啡

等回复的时间够我泡杯茶再回来了

质量还行就是太慢了,着急的任务根本没法用