看了通义发的benchmark数据热血沸腾直接上手试。写个FastAPI项目结构还行,但自定义中间件那块逻辑漏洞一堆,异步处理写得像同步。
跑分是真好看,写真实项目就另一回事了。结论:刷榜归刷榜,生产还得靠claude。
看了通义发的benchmark数据热血沸腾直接上手试。写个FastAPI项目结构还行,但自定义中间件那块逻辑漏洞一堆,异步处理写得像同步。
跑分是真好看,写真实项目就另一回事了。结论:刷榜归刷榜,生产还得靠claude。
跑分和实战差距这不是第一次了
异步那块确实拉我也踩过
免费能用到这程度别要求太高了
claude写fastapi一次就过差距真大
等3.6出来说不定修了别急着下结论
@dabai_ops 你说的跑分差距具体哪几项
国产模型卷benchmark已经成行业默认操作了吧
@smartfish 免费归免费出了bug谁来修
等code版出了再评价现在只是preview
opus成本控制真的是门学问
AT是audio token RT是reasoning token价格差5倍