说真的,用了这么久各种 AI coding 工具,最近才意识到一个被大多数人忽略的问题——不是工具不行,是我们自己没有一套靠谱的工作流。
你有没有这种感觉?让 Claude Code 或者 Cursor 帮你写个东西,描述完需求它就埋头开干,几分钟甩你一坨代码,看着好像能跑,但仔细一看全是坑。没设计、没测试、没审查,改都没法改。
后来我发现一个东西,彻底改变了我对 AI 辅助开发的理解。
GitHub 上 11 万 Star 的 Superpowers
地址:
这玩意是 Anthropic 官方认证的插件,挂在官方插件市场上,安装量 23 万排第二(第一是那个做前端设计的 Frontend Design)。Claude Code、Codex、OpenCode、Cursor 全都能用。
但它不是一个传统意义上的工具,更像是一套"教 Agent 怎么正经干活"的系统。
先说说没有它的时候是什么体验
举个真实例子。我想做一个面向 ADHD 用户的中文阅读辅助工具,打开 Claude Code 的 Plan 模式,把需求丢进去。它问了我几个问题——使用场景、技术栈、想要什么功能——然后就直接开始写了。
出来的东西乍一看还行,但实际上踩了个巨大的坑:它把英文的仿生阅读方案直接套在了中文上。英文单词之间有空格,能找到词的边界,中文字与字之间没有空格,效果直接乱套。而且对公众号、知乎这些国内平台的内容根本抓不到。
说白了不是 AI 笨,是我的需求本身就没想清楚,它问的那几个泛泛的问题也根本覆盖不了真正的边界情况。
装上 Superpowers 之后呢?
同样的需求再来一遍,体验完全不同。
第一步,它不会一股脑问你一堆并行的问题,而是一次只问一个,你答完它再根据你的回答决定下一个问什么——就是苏格拉底式追问,一层一层把需求挖透。
问到核心功能的时候我说我自己也不太懂 ADHD 辅助阅读有哪些方案,它就真的跑去帮我查了一圈资料,回来告诉我仿生阅读对中文用户其实没有显著改善效果,还帮我整理了功能优先级清单。
接着继续拷问:目标浏览器是什么?中文分词库有偏好吗?UI 风格怎么定?一通下来被问得汗流浃背,但确实每个细节都想清楚了。
需求聊透之后,它会给你三个架构方案,每个的优缺点和适用场景列得明明白白,让你自己选。
选完之后还要逐项确认架构细节、功能模块、数据流设计……全部确认完,才会输出一份巨长巨详细的设计文档。
注意,到这里还没写一行代码,这一整段其实只是 14 个 Skill 里的第一个——brainstorming。
后面的流程更硬核
设计文档定了之后,第二步先用 git worktrees 创建隔离工作区,从主分支拉新分支,怎么折腾都不影响原有代码。很多人开发习惯直接在主分支上改,一出问题整个项目全炸,这一步就是专门治这个毛病的。
第三步,把设计文档拆成一个个 2 到 5 分钟就能完成的开发小任务。官方原话特别有意思,说目标是"让一个没有品味、没有判断力、没有项目上下文、而且厌恶测试的热情初级工程师也能照着做"。所以哪怕你用的不是最强模型,靠这套拆解流程照样能拿到不错的产出。
第四步才终于进入编码,而且是开多个子 Agent 并行执行。每个小任务做完都要过两道审查——先看需求有没有做到位、有没有瞎加东西,再看代码质量和可维护性。不通过就打回重来。
全部小任务做完还有一轮全局审查,看模块之间能不能集成、整体有没有遗漏。最后跑验证、合并回主分支、清理工作区,才算结束。
最终做出来的阅读器效果怎么样?
两个核心模式,一个是词性着色,名词动词形容词用不同颜色标出来,句子结构一目了然。另一个是段落聚焦,当前在读的段落高亮,其他段落压暗,读长文的时候注意力不容易跑偏。因为最终选了浏览器插件方案,公众号和知乎也全都能正常用了。
一遍过,省心到离谱。
我现在越来越相信一件事
规划 2 小时,执行 10 分钟,审查 1 小时。真正该花时间的地方永远是动手之前。
这个插件不光能用在写代码上,因为创造任何东西的底层逻辑都差不多:规划、拆解、执行、审查、复盘。拿来做方案策划、做数据分析、做 PPT 都是一样的道理。
安装方式很简单,跟你的 Agent 说一句就行:
装完记得重启,不是热加载。
在我心里这是跟 skill-creator 平级的必装插件,强烈推荐每个用 AI 工具的人都试一下。