各位推荐一个 32G macbook air M5 可以跑的 moe 模型

Q4量化的Qwen2.5-32B在M5 32G上能跑,速度大概25-30t/s

27B跑成智障多半量化太狠,6bit以上保留质量更好