现在想想有点搞笑,4.24那天DeepSeek发了V4模型,我立马就花了一百多。结果后面一整月加起来也就花了一百多。中间那些事你们都懂,账单就不放了,想想那天就肉疼。
钱主要花在这两篇帖子上:
这是第一篇:deepseek-v4-pro + Harness 实战效果
不甘心又搞的第二篇:deepseek-v4-flash + Harness 实践
现在想想有点搞笑,4.24那天DeepSeek发了V4模型,我立马就花了一百多。结果后面一整月加起来也就花了一百多。中间那些事你们都懂,账单就不放了,想想那天就肉疼。
钱主要花在这两篇帖子上:
这是第一篇:deepseek-v4-pro + Harness 实战效果
不甘心又搞的第二篇:deepseek-v4-flash + Harness 实践
楼主这是提前体验了,我当时就觉得再等等看。
是不是因为后面官方调了计费策略?我不太确定哈,但看别人说四月底那会儿确实贵一些。
没用过别碰。
Mark,蹲个后续。
你第二篇里提到用Harness做长上下文测试,具体是怎么设置prompt的?我最近也在折腾这个,感觉有时候输出会丢开头的内容,不知道是不是窗口滑动的问题。
哈哈哈,看到楼主说肉疼,我也想起来一件糗事。之前某个模型刚出来时我着急试,手滑把批量任务数设大了,一夜之间烧掉两百多,吓得我赶紧设了额度提醒。现在学乖了,任何新模型上线先看社区反馈,用小任务跑个简单测试,确认计费逻辑和效果都稳定了再慢慢加量。特别是这种大厂发的模型,初期经常会有计费调整或者隐藏的bug,真的急不得。
你们都在说计费,只有我觉得V4-Pro的推理速度比之前慢吗?我这边同样的硬件,同样的输入长度,每次都要多等两三秒,不知道是不是我个例。
长上下文丢开头我也遇到过,prompt前置摘要能缓解
新模型刚出最容易烧钱,等价格稳了再试
Harness长上下文我也丢过开头,调小窗口能好些
我用滑动窗口开头会丢,换成全量喂进去就好了
我4.24也冲了,结果一个月没用完,体验是真的玄学