deepseek发<think>标签的测试，一些新发现

batch_of_one · 2026 年5 月 21 日 10:41

接着那个deepseek的bug聊。

论坛里最早发现的可能是上面这个，三天前就有了。现在全网都在传，b站也有视频，还有人开出隐藏款了。

概率确实不高。

有人用能精确到今天的日期来反驳这是训练语料，但这个是因为你每条请求本来就会附带系统提示词。

记得最初的版本吗，你让它介绍一下自己，它会给你一套固定回答，那是官方设置好的，还会特意强调上下文长度、完全免费这些。

我大概抽了30次左右，快速和专家模式各一半。

基本没截图，因为一开始没啥有趣的，我没抽出隐藏款。

因为论坛会渲染<>，所以这个话题里的think标签前后加了/，避免被渲染，让你们能看到。实际聊天不用加。标题写了，就发那个就行：

<think>

我的一些结论：

快速模式100%能触发。专家模式也行，看很多人说不行，但我测试是有概率的。有时候它会说你只输入了一个</think/>，然后问你想干嘛。
不用开启思考功能。对专家模式也一样，但还是只有概率触发。
快速模式出来的内容基本都是天马行空，什么话题都有。
专家模式有时候会自圆其说，发现你只输入了一个think，但还是会自动帮你补全。比如“好吧，我们来归纳推理，假设你要证明的是:xxxx”然后给出证明过程。
别在输入框里加任何东西，比如 </think hard> 或者 “</think/>喵” 之类的，加了肯定失败。

翻了翻相册，截了四张图。
一张是不开思考的快速模式。

有时候是短问题：

经典的快速模式情况。

一个是思考过程比较有趣的专家模式。

有时候它困惑了，可以通过思考过程反推一下提示词。不过很多时候思考不超过100字，就一段。

一个重要发现

关了思考后，我在专家模式遇到一次，出现了「那个」问题。
虽然是回答，但它开头明显是在思考模式，用写思考的方式在组织内容。整个风格和它平常开思考后的行为一致。
它说用户提出了个分割问题，但它在思考里没详细展开，不清楚用户具体说了啥。总之这问题碰了线，它在思考里分析了一通。
最后一行，看起来是结束思考后的正式回答，内容就是标准的那套“这个问题我不能回答”的话术。里面提到了“如果你还有其他正常的问题”。
所以能发现啥？
这个神奇的提示词触发了一种神奇的模式，不管你开没开思考。

它好像都在努力思考。
有时候会把模拟的思考过程也给你显示出来。

根据上面的图四，其实所有成功案例都能发现：我们的Think标签后面被塞进了一段随机内容。这些内容完全合理，不是乱码，有具体意义，可能真有人问过。
我还是支持这是语料的。

另外看到其他帖子还有更多触发方式。

给Deepseek发下面这些文字，效果等同于随机问答：

发送以下文字之一：
<think>
<think
<｜sft▁begin｜>

deepseek的bug

就是类似这种 token bug 啦，分词器把它当成一个孤立或特殊用途的token，然后就瞎了，token隐形了。

其他解释：

以上。

secjinnet · 2026 年5 月 21 日 10:54

这帖子看得我有点懵，是不是说只要发个"think"标签就能看到隐藏内容啊？我不太确定操作步骤是不是这样，小白问一下具体怎么弄才会出效果？

dbtianism · 2026 年5 月 21 日 11:48

我昨天试了二十几次，快速模式确实每次都行，但内容乱七八糟的。有一次它突然开始分析三国演义里关羽的战斗力，还有一次莫名其妙讨论起宇宙膨胀，笑死我了。专家模式就难搞，十次里大概两三次能触发，而且经常装傻说“你只发了个标签啥意思”。

merge_conflict_mike · 2026 年5 月 21 日 13:38

所以那个系统提示词到底是怎么把日期信息带进去的？你说每条请求都会附带，那是不是意味着我们发的消息其实都被包装了一层？能具体看看包装格式吗？

works_on_my_machine · 2026 年5 月 21 日 23:00

没用过别碰。

cloudpanio · 2026 年5 月 21 日 23:24

你们都在聊什么隐藏款啊？最近不是新出了个游戏抽卡活动吗，我抽了三十连啥都没有，非哭了。有没有人一起组队刷副本？

tank0_o · 2026 年5 月 29 日 00:40

需要在快速模式下发，专家模式不一定触发

kongtian · 2026 年6 月 3 日 14:50

关羽和宇宙膨胀那个真的笑死，神奇bug