做了三个自定义GPT才搞明白的事，分享给想入坑的同学

pivot_king · 2026 年4 月 14 日 12:54

先交代背景，免得有人觉得我在云吐槽。

我是个独立开发者，从去年GPT Store刚开放那会儿就开始捣鼓自定义GPT，到现在前后做了三个：一个是给自己用的写作助手（润色英文邮件那种），一个是数据分析的（喂它Excel让它出图表 + 简单结论），还有一个是帮朋友公司做的客服bot，对接了他们的产品文档。

三个GPT做下来，踩的坑加起来够写一篇小作文了。今天有空，挑几个实用的说说。

1. Instructions别写太长

刚开始我以为Instructions就是越详细越好，恨不得把所有规则都列出来。第一版写作助手的Instructions我写了快3000字，结果发现模型经常"忘"——你让它做A它给你做B，让它用正式语气它输出口语。

后来翻了一些资料 + 自己测试，发现一个很反直觉的事：Instructions字数限制虽然是8000字符左右，但实际控制在800字以内效果最好。超过这个量级，模型对前后文的权重分配就开始飘。

我后来重写了一版，砍到600字左右，效果反而稳定了。给点经验：能用例子就别用规则，能用一句话就别写一段。

2. Knowledge文件那个512MB是个坑

官方说单文件最大512MB、最多20个文件。听起来很慷慨对吧？但你真把一个300MB的PDF扔上去，检索质量就拉胯了——它不是真的"读"完整个文件，而是做chunking + embedding + RAG那一套。

我做客服bot的时候，一开始把朋友公司的产品文档（一个200MB的PDF合集）整个上传，结果用户问的问题很多它答不上来，或者答得驴唇不对马嘴。

后来我把文件拆成20个左右的小Markdown文件，每个文件一个主题，命名清晰（比如pricing.md、refund_policy.md），retrieval质量立刻好了一大截。

这里其实有个小tip：GPT似乎更喜欢Markdown格式，比PDF和Docx都好。可能跟训练数据的分布有关吧，也可能就是巧合。

3. Actions接API真的反人类

如果只是聊天那种GPT，做起来很轻松。但要让GPT能调外部API（比如查天气、查订单、发邮件），你就得写OpenAPI 3.1 schema。

写schema这事儿，文档说得云淡风轻，实际写起来——尤其是处理authentication和复杂response时——能把人逼疯。我做客服bot要接朋友公司一个内部CRM API，前后调试了两天才让GPT能稳定调用。

GPT Builder里的debug能力又非常弱，基本就是"调失败了"几个字，连具体错在哪都不告诉你。我后来都是用Postman先把API调通，再小心翼翼地写schema扔进去。

4. Conversation Starters真的很重要

这个一开始我没在意，觉得就是几个示例问题嘛，随便填填。结果后来发现，用户进来第一眼就看这4个（最多4个）启动话题——它们直接决定用户会不会留下来玩。

我那个写作助手刚开始的Conversation Starters写得很泛（“帮我写一封邮件”），后来改得很具体（“帮我写一封拒绝供应商涨价的邮件，语气要客气但坚定”），使用率立刻上来了。

启动语本质上是给用户做"示范"——告诉他你能干什么、怎么用最好。

5. GPT Store的算法其实很现实

最后说个略丧的事：GPT Store的推荐算法明显偏向已经有高使用量的GPT，新人GPT几乎没有自然流量。我那三个GPT没有一个上过任何榜单，加起来也就攒了几千次使用，绝大多数还是我自己拉的人头。

Revenue Share今年3月开始的，但实际能拿到钱的创作者非常少，圈里很多人吐槽——我自己一分钱没收到过。所以如果你是奔着"做个GPT赚钱"来的，劝你三思。

结尾

整体来说，做自定义GPT这件事，我觉得对个人提效是真有用的，但要做成产品/赚钱很难。

如果你刚要入坑，我的建议是：从一个你自己每天都会用的小工具开始做，不要一上来就想做"通用型助手"。

有问题欢迎讨论，我能答的都尽量答。

embedding_guru · 2026 年4 月 14 日 12:57

楼主说Markdown效果好，这个我深有体会，补充一下知识文件格式的坑。

我之前给客户做过一个法律咨询GPT，最早把一堆法律案例的PDF直接传上去，结果retrieval出来的内容经常带着乱七八糟的格式符号，像是PDF里的页眉页脚、页码、甚至有些扫描件OCR残留的乱码。GPT读到这些东西容易"分心"，回答的时候会把无关内容当成上下文。

后来我做了几个对比测试：

PDF（文本型）：勉强能用，但retrieval噪音大，特别是有表格和多栏排版的
PDF（扫描型）：基本不可用，OCR质量决定一切，建议先自己OCR完处理过再传
DOCX：比PDF好一点，但还是有格式残留
TXT：检索很干净，但因为没结构，GPT定位上下文边界不够准
Markdown：综合最好，标题层级能帮GPT理解文档结构，retrieval也干净

另外有个细节：文件名真的会影响检索。我有次把文件命名成doc1.md、doc2.md，GPT明显对它们的"主题判断"很模糊。改成labor_law_chapter3.md这种描述性命名后，相关性匹配立刻好了。

还有就是别把所有东西塞一个文件里，一个文件最好聚焦一个主题，5-20MB是个比较舒服的大小。

certified_yaml_hater · 2026 年4 月 14 日 13:00

OpenAPI schema那段我血压上来了…写过的都懂，光是处理nested object就能调一下午，错误信息还跟猜谜一样。

aigc_chuangzuo · 2026 年4 月 14 日 13:03

说说我自己的经历，给楼主补充点不一样的视角。

我做了一个偏小众的GPT（中文古诗词意境分析的），运气不错，去年被GPT Store某个推荐位带过一波量，累计使用量大概30万次。Revenue Share我也参与了，从今年3月OpenAI开始给创作者发钱算起，到现在前后收到过两次，加起来不到200美元。

听起来好像还行，但要算时薪的话简直是惨不忍睹——前后投入估计有60+小时。而且OpenAI的revenue share算法是黑盒，你不知道是按使用次数、还是按用户活跃度、还是按订阅价值的某个比例算的。我有个朋友的GPT使用量比我大10倍，但他一分钱都没收到。

后来跟圈里几个做GPT的人聊，发现大家普遍的感受是：

revenue share实际发放面非常窄，国内创作者收到钱的更少（有些是因为支付渠道问题）
头部GPT（榜单前列那些）也没传说中赚那么多，大部分月入也就几百美元到几千美元
真正赚到钱的反而是用GPTs做引流，把用户导到自己的SaaS或服务上

所以我现在的建议跟楼主类似：把GPT当成一个免费的获客渠道用，别指望它本身能赚多少钱。

pivot_king · 2026 年4 月 14 日 13:06

@aigc_chuangzuo 你这个数据挺真实的，30万使用量+200美元，确实跟传说中"GPT Store创作者经济"差距很大。我那点流量看来再怎么优化也是杯水车薪，老老实实做工具吧。

devrel_diana · 2026 年4 月 14 日 13:09

楼主提到Conversation Starters，我从产品经理的角度展开聊一下，这块其实远比大多数人想得重要。

我之前在一家做ToB AI产品的公司做PM，亲自负责过一个内部GPT的launch。我们做了大概3周的A/B测试，专门测Conversation Starters的不同写法对用户留存的影响，结论很有意思：

1. 启动语决定了用户的"使用心智模型"

你写"帮我写邮件" vs “帮我写一封拒绝面试邀请的邮件，语气要礼貌”，这两种启动语吸引来的用户后续行为完全不一样。前者吸引的用户会试探性地输入各种东西（“你能干嘛？”），后者吸引的用户会直接复用模式（“那帮我写一封拒绝offer的”）。

后者的留存率在我们的测试里高了将近40%。

2. 启动语应该展示"能力上限"，不是"基础功能"

很多人写Conversation Starters会写"帮我写邮件"、"帮我翻译"这种基础的，其实这样反而拉低了用户预期。更好的写法是写一个相对复杂、看起来"哇这都能做"的例子。

比如不要写"帮我写邮件"，写"帮我以CTO的身份写一封解释技术债的邮件给非技术背景的CEO"。

3. 4个启动语应该覆盖不同场景，不要重复

OpenAI最多允许4个Conversation Starters，很多人会写4个相似的（都是写邮件的不同变体）。这是浪费。最好的做法是这4个分别覆盖你GPT能做的4种典型场景，让用户对能力边界有概念。

4. 用第一人称写

"帮我…"比"你能…"效果好。前者让用户感觉是自己在说话，更容易代入；后者像是在跟客服对话，反而生疏。

这个细节小，但实测有差距。

5. 启动语会被算法当作主题信号

GPT Store的搜索和推荐算法会从启动语里提取关键词作为主题信号。所以如果你想让你的GPT在某些关键词下被搜到，启动语里要自然地包含这些词。

总之，4条启动语别随便写，那是你产品的"店面橱窗"。

context_window_carl · 2026 年4 月 14 日 13:12

新手问题：GPTs和Assistants API到底有什么区别？我看官方文档说得有点绕。

自己研究了一下，简单说：

GPTs是面向C端消费者的No-code平台，你在浏览器里点点点就能搭一个，发布到GPT Store给所有人用，需要订阅Plus才能用。本质是"用别人的UI + 你的prompt和knowledge"。
Assistants API是给开发者的编程接口，你可以在自己的App里调用，对接自己的UI，按token计费。功能更灵活（threads、code interpreter、file search等都可以编程控制），但需要你自己写代码集成。

简单判断：你想做个让朋友们玩的工具→GPTs；你想集成到自己产品里给客户用→Assistants API。

两者底层是相通的，但定位完全不同的用户群。

gpts_laoyouxi · 2026 年4 月 16 日 05:48

做了十几个 GPTs 最后发现都不如写好一个提示词

saltwitch · 2026 年4 月 18 日 01:30

OpenAPI schema那段血压也升高，nested让人崩溃

xianjia_mei · 2026 年4 月 22 日 18:32

自定义 GPT 商店里 99 percent 都是垃圾真没用