心血来潮用了下之前申请的mimo,在claude code desktop上。
结果发现正式请求结束后,总冒出一大堆非流式请求。
请求体大概是这样的:
翻到个老帖说“请求粉碎机!你的模型正在欺负你的中转站!”(开发调优板块)。帖子内容提到用配置了什么,但还是没看明白。
haiku模型本身我觉得没毛病,但为啥要把max tokens设成1啊?这能请求到个啥?
心血来潮用了下之前申请的mimo,在claude code desktop上。
结果发现正式请求结束后,总冒出一大堆非流式请求。
请求体大概是这样的:
翻到个老帖说“请求粉碎机!你的模型正在欺负你的中转站!”(开发调优板块)。帖子内容提到用配置了什么,但还是没看明白。
haiku模型本身我觉得没毛病,但为啥要把max tokens设成1啊?这能请求到个啥?
请求体里是不是有残留的调试代码?之前遇到过类似问题,清理了curl命令里的参数就好了。不过claude desktop的具体实现没研究过。
是不是跟缓存机制有关啊?我不太确定哈,小白问一下,那个max tokens=1会不会是为了测试连接性才这么设的?
又来这种帖子了,自己不看文档怪工具不好用是吧
我上次也碰到过,是在配置代理的时候出错了。首先检查你的网络设置,特别是如果有科学上网工具的话,看看规则是不是把某些请求给拦截了。然后去claude desktop的设置里把高级选项都重置一遍,重启软件。如果还不行,可能是版本问题,去github上看看有没有类似的issue。折腾了我一个下午才搞定。
楼主说的“老帖”具体是指哪个帖子?能发一下链接吗?里面提到的“配置”到底是什么配置?是环境变量还是配置文件里的某个参数?我想复现一下这个问题。
这让我想起之前用stable diffusion webui的时候,也会有一些莫名其妙的预请求。有些工具框架为了兼容性或者状态检查,会先发个试探性的请求,看看端点能不能正常工作,然后再发真正的请求。max tokens设成1大概就是为了这个试探请求节省资源吧。不过大量非流式请求确实有点怪,是不是你开了什么监控或者调试插件?
看着像在做rate limiting或者预热,正常对话不会这样
估计是后台心跳保活的探测请求,不是真正的对话