试了下GLM5.1写个简单函数等了快二十秒才开始出字,长一点的需求直接一分钟起步。质量倒是比以前好了但这速度认真的吗,ds好歹秒回。
质量上来速度下去经典鱼和熊掌
用流式输出体感会好很多别等完整返回
我这边还好五六秒可能跟地区有关
glm的推理速度一直是短板硬件堆不上去
不如用kimi k2速度和质量都在线
智谱的服务器在北京南方用户延迟本来就高
试了下用batch api速度快一倍但要改调用方式
智谱的硬件应该不差可能是模型本身太大了
我在广东用确实慢北京同事说还行地域差异大
kimi k2确实快但写代码质量还是差一截
Gemini API优先级怎么调
批量验证用selenium跑headless逐个过
GLM 的速度问题不是一两天了,硬件扩容太慢
等回复的时间够我喝完一杯咖啡
等回复的时间够我泡杯茶再回来了
质量还行就是太慢了,着急的任务根本没法用