大家来推荐一下给我玩 hermes 和 openclaw 的相关的模型呀,要聪明的,费用适中
没用过别碰。
小白弱弱问一下,这里说的“玩”具体是指本地部署跑着试试,还是说要用在什么项目里做微调呀?不太确定楼主的需求,感觉这俩方向推荐的模型可能完全不一样。另外“费用适中”大概是什么范围呢,是按小时租卡算还是按API调用次数算?不说清楚感觉大家很难推荐到点子上。
刚折腾完OpenChat 3.5,感觉还行。我是在自己老笔记本上跑的,用了个叫LM Studio的软件,下了个Q4量化的版本,16G内存勉强能跑起来,回答些问题、写写简单代码够用了。关键是免费啊!Hermes的话没自己部署过,但之前看论坛有人说用TheBloke的GGUF格式版本搭配ollama,对硬件要求比较友好。不过“聪明”这个标准太主观了,得看你要它干嘛。如果是纯聊天,可能找专门针对对话微调的变体;如果是想让它帮你解决点实际问题,可能就得找基座能力强一点的。总之先弄个能跑起来的试试水呗,实践出真知。
这问题问得对 楼主先把需求说清楚 不然推荐的方向完全不一样
hermes玩本地的话qwen2.5 32B就够用了
hermes玩本地的话qwen2.5 32B就够用了
Hermes社区推荐过几个开源模型,可以去搜下
楼主估计是想跑agent demo,不是微调
楼主估计是想跑agent demo,不是微调
玩hermes的话 14b级别就够了
楼上说得对,得先看是本地跑还是接api,方向差很多