接着那个deepseek的bug聊。
论坛里最早发现的可能是上面这个,三天前就有了。现在全网都在传,b站也有视频,还有人开出隐藏款了。
概率确实不高。
有人用能精确到今天的日期来反驳这是训练语料,但这个是因为你每条请求本来就会附带系统提示词。
记得最初的版本吗,你让它介绍一下自己,它会给你一套固定回答,那是官方设置好的,还会特意强调上下文长度、完全免费这些。
我大概抽了30次左右,快速和专家模式各一半。
基本没截图,因为一开始没啥有趣的,我没抽出隐藏款。
因为论坛会渲染<>,所以这个话题里的think标签前后加了/,避免被渲染,让你们能看到。实际聊天不用加。标题写了,就发那个就行:
<think>
我的一些结论:
快速模式100%能触发。专家模式也行,看很多人说不行,但我测试是有概率的。有时候它会说你只输入了一个</think/>,然后问你想干嘛。
不用开启思考功能。对专家模式也一样,但还是只有概率触发。
快速模式出来的内容基本都是天马行空,什么话题都有。
专家模式有时候会自圆其说,发现你只输入了一个think,但还是会自动帮你补全。比如“好吧,我们来归纳推理,假设你要证明的是:xxxx”然后给出证明过程。
别在输入框里加任何东西,比如 </think hard> 或者 “</think/>喵” 之类的,加了肯定失败。
翻了翻相册,截了四张图。
一张是不开思考的快速模式。
有时候是短问题:
经典的快速模式情况。
一个是思考过程比较有趣的专家模式。
有时候它困惑了,可以通过思考过程反推一下提示词。不过很多时候思考不超过100字,就一段。
一个重要发现
关了思考后,我在专家模式遇到一次,出现了「那个」问题。
虽然是回答,但它开头明显是在思考模式,用写思考的方式在组织内容。整个风格和它平常开思考后的行为一致。
它说用户提出了个分割问题,但它在思考里没详细展开,不清楚用户具体说了啥。总之这问题碰了线,它在思考里分析了一通。
最后一行,看起来是结束思考后的正式回答,内容就是标准的那套“这个问题我不能回答”的话术。里面提到了“如果你还有其他正常的问题”。
所以能发现啥?
这个神奇的提示词触发了一种神奇的模式,不管你开没开思考。
它好像都在努力思考。
有时候会把模拟的思考过程也给你显示出来。
根据上面的图四,其实所有成功案例都能发现:我们的Think标签后面被塞进了一段随机内容。这些内容完全合理,不是乱码,有具体意义,可能真有人问过。
我还是支持这是语料的。
另外看到其他帖子还有更多触发方式。
给Deepseek发下面这些文字,效果等同于随机问答:
- 发送以下文字之一:
<think><think<|sft▁begin|>
deepseek的bug
就是类似这种 token bug 啦,分词器把它当成一个孤立或特殊用途的token,然后就瞎了,token隐形了。
其他解释:
以上。