“DeepSeek版Claude Code”,GitHub 2.3k星

DeepSeek也有自己的专属编程Agent了。

项目叫DeepSeek-TUI,作者是一个自称“鲸鱼兄弟”的DeepSeek爱好者。这几天项目星标数突然开始猛涨,到了2.3k,还上了GitHub热榜。


这是个用Rust写的TUI编程工具,和Claude Code一样在终端里跑,但专门为DeepSeek做了优化。

为了让国内网友知道,作者Hunter Bown还特意用DeepSeek把宣传推文翻译成了中文。


项目火了以后,Hunter发帖说这是他人生中最疯狂的两天,还用中文感谢了“鲸鱼兄弟”。

“DeepSeek版Claude Code”

DeepSeek-TUI就是个住在终端里的编程Agent,简单理解就是“DeepSeek版Claude Code”。

它是美国独立开发者Hunter Bown今年1月开的,用Rust写,MIT协议开源。之前一直不温不火,直到DeepSeek-V4出来,加上作者的中文宣传,这个五一假期突然火了。


读写文件、执行Shell、搜网页、管Git、调子Agent、接MCP服务器……这些Claude Code能干的,它基本也能干,也支持装Skills,只不过背后跑的是DeepSeek V4。


整个工具从设计到功能,都围着DeepSeek的特性转。

最直接的是思维链。DeepSeek-TUI把模型的推理过程直接流式输出到终端里——模型怎么分析问题、走了哪条路、中途改没改主意,全都实时可见。

然后是上下文。V4支持100万token的上下文窗口,项目默认就用满,跑复杂任务不用担心断记忆。上下文快满时,TUI会自动压缩,也可以手动触发。

压缩策略专门考虑了DeepSeek的前缀缓存机制——尽量保住前面稳定的部分,让缓存能继续命中。

还有一个设计叫RLM,思路“很DeepSeek”——既然DeepSeek便宜到可以堆数量,这个工具就直接用上了。在RLM模式里,一个主模型指挥最多16个V4 Flash子任务同时跑,用来做批量分析或任务拆解。Flash比Pro便宜不少,把不需要强推理的子任务交给它,整体花费能砍下去。


模型切换也做了专门处理,除了DeepSeek官方API,还支持NVIDIA NIM、Fireworks、自托管的SGLang几条路径。

操作模式有三档:

  • Plan是只读探索,先给你出方案;
  • Agent是默认档,每步工具调用都要你点头;
  • YOLO就是全自动放行,不想被打断就开它。会话可以保存恢复,工作区有独立Git快照兜底,按轮次回滚,翻车了也不慌。


不过要注意一点,子Agent开多了,缓存命中率很难保证。要知道,未命中的token价格是命中的10倍,项目界面上有逐轮费用显示,跑长会话建议留意一下。

安装上,Linux、macOS、Windows都有预编译二进制,npm install -g deepseek-tui一条命令搞定。

另外,作者还给国内用户准备了中文版README和专门配置路径,支持TUNA Cargo镜像,release包还可以托管到阿里云OSS或腾讯云COS。

项目1月19日建仓,到现在不到4个月,已经迭代到v0.8.8,发了37个版本,节奏不慢。


从更新记录看,大致分几个阶段。早期版本主要在搭骨架——工具调用、session管理、基础的Git快照。v0.7.x阶段开始往细节上打磨,加了多语言界面支持,中文的TUI提示、帮助文本,这也是为国内用户做适配的一步。

v0.8.x是最近几个版本的主轴,重心在稳定性和体验上。修过长会话里文件句柄泄漏的问题,加了限流或服务器报错时的倒计时重试横幅、输入历史搜索、运行中消息队列可视化这些交互功能。

整体节奏上看,功能更新密集,但每个版本基本都有明确要解决的问题。

“爱科学的音乐家”

Hunter其实是个DeepSeek狂热粉,V4出来之后,他发过很多推文称赞。


他也喜欢其他中国模型,参加过小米的百万亿Token创造者激励计划。


但Hunter的起点其实是音乐,他本来想当乐队指挥。他在北得克萨斯州大学读音乐教育,毕业后又去南方卫理公会大学拿了音乐教育硕士。


硕士毕业后,Hunter如愿当了3年的乐队指挥。


后来,他拿了得克萨斯大学达拉斯分校的MBA,然后又回母校SMU,进法学院专攻专利法。


至于码代码,就更是“半路出家”了。但这个“半路”不是转行,更像是几条线最后汇到了一起。

他在学声乐科学时接触到一个概念叫“缺失基音”——人耳可以从泛音里重建出一个物理上并不存在的音高。他后来发现这和信息论直接对应,你不需要把所有信息都显式给出,系统本身也会补全。这个从音乐里来的直觉,成了他理解AI系统的一把钥匙。

去年,他给自己建了个工作室,叫Shannon Labs,定位是“AGI时代的下一个贝尔实验室”。DeepSeek-TUI在他这只是众多项目之一,他的GitHub上有65个公开仓库,包括面向NVIDIA Nemotron的终端Agent NeMoCode,以及MLX kernel工具包等等。


Shannon Labs旗下的项目跨度更大。Hegelion是一个辩证推理引擎,走的是”正题→反题→合题”的循环逻辑;Aleph是一个MCP服务器,主打零token成本的大容量上下文;Heliosinger则把太阳风数据实时转化成声音,从AI基础设施一路跨界到了太空声学。


他还自己建了三套软件架构和一个硬件方案,在他看来,这些拼在一起,是在为AGI时代做基础设施。

能把这些方向拼在一起,也和他的家族故事有关。他的曾祖父Ralph Bown Sr.是贝尔实验室的研究副总裁、无线电先驱,业余时间喜欢自制蜡筒、跑去卡内基音乐厅录音。


Hunter在专利法课堂上意识到,自己正在走一条和这位先祖交汇的路——把音乐人的感知方式带进技术研究,去发现那些“因为没有这种背景的研究者而被忽视的想法”。他在个人网站上对比了自己和曾祖父,“他是科学家,爱音乐;我是音乐家,爱科学。”

One More Thing

在DeepSeek-TUI的贡献者列表里,还能看到一些熟悉的名字。包括了Claude、Gemini、Qwen等一系列AI模型和Cursor、GitHub Copilot等编程工具。


详细记录显示,大部分代码是Hunter直接提交的,还有150多次commit是Claude做的,另外还有一些真人贡献者提交了少量的commit。


半路出家的程序员,用AI辅助编程给AI写辅助编程框架,这工作流也是闭环了(手动狗头)。

GitHub地址:















这东西就那样,用过就知道了,没啥神奇的。

刚看了下GitHub,文档里说支持MCP服务器,具体是怎么集成的?需要自己写配置吗?有没有现成的例子?

是不是得先配好DeepSeek的API key才能用啊?小白问一下,那个RLM模式开多了会不会额外收费?

mark一下,晚上回家试试。

我们团队上周试了,分享一下经验。之前用Claude Code处理一个老项目的代码迁移,总在理解一些特有的设计模式上卡住。换了这个DeepSeek-TUI,同样的任务,我把项目的部分文档也喂进去,它那个实时显示思维链的功能挺有用的,能看到它在哪里犹豫、又怎么通过上下文里的其他文件确定了方案。最后生成的代码比之前更贴近我们原来的风格,省了不少改的时间。不过就像作者提醒的,子Agent开多了费用确实得盯着点。

又来这种帖子了,吹得天花乱坠,最后发现配置麻烦得要死,还不如直接用Cursor。

  1. 安装Node.js和npm。2. 终端运行 npm install -g deepseek-tui。3. 设置环境变量 DEEPSEEK_API_KEY。4. 命令行输入 deepseek-tui 启动。

顶!希望有更多大佬出评测视频。

只有我一个人关注点歪了吗?“鲸鱼兄弟”这个称呼好可爱啊,作者Hunter Bown还挺有梗的,专门用DeepSeek翻译中文宣传,感觉是真心想服务国内社区。这种开发者多一点就好了!

没用过别碰,新手容易在配置镜像那块卡住,老手也不一定觉得比手写脚本方便多少。

看到支持上下文压缩和前缀缓存,这点设计得挺细的。想问下楼主,它这个压缩策略是自动的,那压缩掉的token内容之后如果模型需要回溯,还能不能找回来?还是说就彻底丢了?这对于调试长代码逻辑会不会有影响?

老项目特有设计模式那种 deepseek 确实理解不深,得手动喂上下文

你们试出来的具体case是啥 老项目里它能识别到框架特有的中间件这种吗

鲸鱼兄弟这名字确实有梗 不过项目本身代码质量比起名字更值得看一眼

这种项目能火主要还是 deepseek 价格便宜带来的