deepseek发<think>标签的测试,一些新发现

接着那个deepseek的bug聊。

论坛里最早发现的可能是上面这个,三天前就有了。现在全网都在传,b站也有视频,还有人开出隐藏款了。

概率确实不高。

有人用能精确到今天的日期来反驳这是训练语料,但这个是因为你每条请求本来就会附带系统提示词。

记得最初的版本吗,你让它介绍一下自己,它会给你一套固定回答,那是官方设置好的,还会特意强调上下文长度、完全免费这些。

我大概抽了30次左右,快速和专家模式各一半。

基本没截图,因为一开始没啥有趣的,我没抽出隐藏款。

因为论坛会渲染<>,所以这个话题里的think标签前后加了/,避免被渲染,让你们能看到。实际聊天不用加。标题写了,就发那个就行:

<think>

我的一些结论:

快速模式100%能触发。专家模式也行,看很多人说不行,但我测试是有概率的。有时候它会说你只输入了一个</think/>,然后问你想干嘛。
不用开启思考功能。对专家模式也一样,但还是只有概率触发。
快速模式出来的内容基本都是天马行空,什么话题都有。
专家模式有时候会自圆其说,发现你只输入了一个think,但还是会自动帮你补全。比如“好吧,我们来归纳推理,假设你要证明的是:xxxx”然后给出证明过程。
别在输入框里加任何东西,比如 </think hard> 或者 “</think/>喵” 之类的,加了肯定失败。

翻了翻相册,截了四张图。
一张是不开思考的快速模式。

有时候是短问题:

经典的快速模式情况。

一个是思考过程比较有趣的专家模式。

有时候它困惑了,可以通过思考过程反推一下提示词。不过很多时候思考不超过100字,就一段。

一个重要发现

关了思考后,我在专家模式遇到一次,出现了「那个」问题。
虽然是回答,但它开头明显是在思考模式,用写思考的方式在组织内容。整个风格和它平常开思考后的行为一致。
它说用户提出了个分割问题,但它在思考里没详细展开,不清楚用户具体说了啥。总之这问题碰了线,它在思考里分析了一通。
最后一行,看起来是结束思考后的正式回答,内容就是标准的那套“这个问题我不能回答”的话术。里面提到了“如果你还有其他正常的问题”。
所以能发现啥?
这个神奇的提示词触发了一种神奇的模式,不管你开没开思考。

它好像都在努力思考。
有时候会把模拟的思考过程也给你显示出来。

根据上面的图四,其实所有成功案例都能发现:我们的Think标签后面被塞进了一段随机内容。这些内容完全合理,不是乱码,有具体意义,可能真有人问过。
我还是支持这是语料的。

另外看到其他帖子还有更多触发方式。

给Deepseek发下面这些文字,效果等同于随机问答:

  1. 发送以下文字之一:
<think>
<think
<|sft▁begin|>

deepseek的bug

就是类似这种 token bug 啦,分词器把它当成一个孤立或特殊用途的token,然后就瞎了,token隐形了。

其他解释:

以上。

这帖子看得我有点懵,是不是说只要发个"think"标签就能看到隐藏内容啊?我不太确定操作步骤是不是这样,小白问一下具体怎么弄才会出效果?

我昨天试了二十几次,快速模式确实每次都行,但内容乱七八糟的。有一次它突然开始分析三国演义里关羽的战斗力,还有一次莫名其妙讨论起宇宙膨胀,笑死我了。专家模式就难搞,十次里大概两三次能触发,而且经常装傻说“你只发了个标签啥意思”。

所以那个系统提示词到底是怎么把日期信息带进去的?你说每条请求都会附带,那是不是意味着我们发的消息其实都被包装了一层?能具体看看包装格式吗?

没用过别碰。

你们都在聊什么隐藏款啊?最近不是新出了个游戏抽卡活动吗,我抽了三十连啥都没有,非哭了。有没有人一起组队刷副本?

需要在快速模式下发,专家模式不一定触发

关羽和宇宙膨胀那个真的笑死,神奇bug