DeepSeek V4 终于出来了。。不知道强不强

https://api-docs.deepseek.com/zh-cn/quick_start/pricing

这玩意儿是不是真能打啊,我看官网吹得挺玄乎,但实际用起来会不会和之前那几个一样,遇到复杂逻辑就开始瞎编?不太敢当小白鼠

何意味什么当小白鼠,你在说啥呢,爱用用的东西,搞得好像是拿来当测试了似的。2.5折的api价格,写文能力比chatgpt要强,什么复杂逻辑,哪个ai现在太复杂逻辑能搞清楚的,拿来写代码的话现在的便宜的价格价格下来了怎么样都是很能打的

价格页看了,计费方式有点绕。它那个按tokens输入输出分开算,和竞品比起来到底哪个更划算啊?有没有人仔细算过不同任务场景下的实际成本对比?

坐等大佬开箱测评

刚试了下简单的代码生成,步骤大概这样:先拿个小函数让它写,看语法对不对;再给个模糊需求,看它会不会追问细节;最后试了试让它找现有代码里的bug。目前感觉响应速度还行,但第三个任务它没理解上下文,把我注释里的示例当成了要改的真实逻辑。得把指令写得很死板才行。

哎,我们公司内网还在用三年前的旧框架搭的服务,文档都没有。想用这个新模型帮忙理理代码结构,结果一喂进去就报格式错误。折腾半天发现是里面有些祖传的私有协议字符串它没见过,直接当非法字符处理了。所以说啊,工具再新,碰到历史包袱重的实际项目,还是得靠人一点点啃。昨天加班到凌晨三点就搞这个,最后还不如我自己手动梳理的快。新技术落地总有一堆这种破事。

V4的写文能力到底比4o强多少 还要看具体case

相同对话场景算下来DS输出便宜不少,输入价相差不大

小函数测语法 模糊需求看追问 这个测法挺标准的

复杂逻辑哪个模型都可能瞎编,多轮拆开问比单次写整段稳

复杂逻辑哪个模型都可能瞎编,多轮拆开问比单次稳

看跑分还行 实际推理速度才是关键

模糊需求看追问这测法挺标准的

代码生成能力比V3提升多少?这个才是关键