做了三个自定义GPT才搞明白的事,分享给想入坑的同学

先交代背景,免得有人觉得我在云吐槽。

我是个独立开发者,从去年GPT Store刚开放那会儿就开始捣鼓自定义GPT,到现在前后做了三个:一个是给自己用的写作助手(润色英文邮件那种),一个是数据分析的(喂它Excel让它出图表 + 简单结论),还有一个是帮朋友公司做的客服bot,对接了他们的产品文档。

三个GPT做下来,踩的坑加起来够写一篇小作文了。今天有空,挑几个实用的说说。

1. Instructions别写太长

刚开始我以为Instructions就是越详细越好,恨不得把所有规则都列出来。第一版写作助手的Instructions我写了快3000字,结果发现模型经常"忘"——你让它做A它给你做B,让它用正式语气它输出口语。

后来翻了一些资料 + 自己测试,发现一个很反直觉的事:Instructions字数限制虽然是8000字符左右,但实际控制在800字以内效果最好。超过这个量级,模型对前后文的权重分配就开始飘。

我后来重写了一版,砍到600字左右,效果反而稳定了。给点经验:能用例子就别用规则,能用一句话就别写一段。

2. Knowledge文件那个512MB是个坑

官方说单文件最大512MB、最多20个文件。听起来很慷慨对吧?但你真把一个300MB的PDF扔上去,检索质量就拉胯了——它不是真的"读"完整个文件,而是做chunking + embedding + RAG那一套。

我做客服bot的时候,一开始把朋友公司的产品文档(一个200MB的PDF合集)整个上传,结果用户问的问题很多它答不上来,或者答得驴唇不对马嘴。

后来我把文件拆成20个左右的小Markdown文件,每个文件一个主题,命名清晰(比如pricing.mdrefund_policy.md),retrieval质量立刻好了一大截。

这里其实有个小tip:GPT似乎更喜欢Markdown格式,比PDF和Docx都好。可能跟训练数据的分布有关吧,也可能就是巧合。

3. Actions接API真的反人类

如果只是聊天那种GPT,做起来很轻松。但要让GPT能调外部API(比如查天气、查订单、发邮件),你就得写OpenAPI 3.1 schema。

写schema这事儿,文档说得云淡风轻,实际写起来——尤其是处理authentication和复杂response时——能把人逼疯。我做客服bot要接朋友公司一个内部CRM API,前后调试了两天才让GPT能稳定调用。

GPT Builder里的debug能力又非常弱,基本就是"调失败了"几个字,连具体错在哪都不告诉你。我后来都是用Postman先把API调通,再小心翼翼地写schema扔进去。

4. Conversation Starters真的很重要

这个一开始我没在意,觉得就是几个示例问题嘛,随便填填。结果后来发现,用户进来第一眼就看这4个(最多4个)启动话题——它们直接决定用户会不会留下来玩。

我那个写作助手刚开始的Conversation Starters写得很泛(“帮我写一封邮件”),后来改得很具体(“帮我写一封拒绝供应商涨价的邮件,语气要客气但坚定”),使用率立刻上来了。

启动语本质上是给用户做"示范"——告诉他你能干什么、怎么用最好。

5. GPT Store的算法其实很现实

最后说个略丧的事:GPT Store的推荐算法明显偏向已经有高使用量的GPT,新人GPT几乎没有自然流量。我那三个GPT没有一个上过任何榜单,加起来也就攒了几千次使用,绝大多数还是我自己拉的人头。

Revenue Share今年3月开始的,但实际能拿到钱的创作者非常少,圈里很多人吐槽——我自己一分钱没收到过。所以如果你是奔着"做个GPT赚钱"来的,劝你三思。

结尾

整体来说,做自定义GPT这件事,我觉得对个人提效是真有用的,但要做成产品/赚钱很难。

如果你刚要入坑,我的建议是:从一个你自己每天都会用的小工具开始做,不要一上来就想做"通用型助手"。

有问题欢迎讨论,我能答的都尽量答。

1 个赞

楼主说Markdown效果好,这个我深有体会,补充一下知识文件格式的坑。

我之前给客户做过一个法律咨询GPT,最早把一堆法律案例的PDF直接传上去,结果retrieval出来的内容经常带着乱七八糟的格式符号,像是PDF里的页眉页脚、页码、甚至有些扫描件OCR残留的乱码。GPT读到这些东西容易"分心",回答的时候会把无关内容当成上下文。

后来我做了几个对比测试:

  • PDF(文本型):勉强能用,但retrieval噪音大,特别是有表格和多栏排版的
  • PDF(扫描型):基本不可用,OCR质量决定一切,建议先自己OCR完处理过再传
  • DOCX:比PDF好一点,但还是有格式残留
  • TXT:检索很干净,但因为没结构,GPT定位上下文边界不够准
  • Markdown:综合最好,标题层级能帮GPT理解文档结构,retrieval也干净

另外有个细节:文件名真的会影响检索。我有次把文件命名成doc1.mddoc2.md,GPT明显对它们的"主题判断"很模糊。改成labor_law_chapter3.md这种描述性命名后,相关性匹配立刻好了。

还有就是别把所有东西塞一个文件里,一个文件最好聚焦一个主题,5-20MB是个比较舒服的大小。

2 个赞

OpenAPI schema那段我血压上来了…写过的都懂,光是处理nested object就能调一下午,错误信息还跟猜谜一样。

1 个赞

说说我自己的经历,给楼主补充点不一样的视角。

我做了一个偏小众的GPT(中文古诗词意境分析的),运气不错,去年被GPT Store某个推荐位带过一波量,累计使用量大概30万次。Revenue Share我也参与了,从今年3月OpenAI开始给创作者发钱算起,到现在前后收到过两次,加起来不到200美元。

听起来好像还行,但要算时薪的话简直是惨不忍睹——前后投入估计有60+小时。而且OpenAI的revenue share算法是黑盒,你不知道是按使用次数、还是按用户活跃度、还是按订阅价值的某个比例算的。我有个朋友的GPT使用量比我大10倍,但他一分钱都没收到。

后来跟圈里几个做GPT的人聊,发现大家普遍的感受是:

  1. revenue share实际发放面非常窄,国内创作者收到钱的更少(有些是因为支付渠道问题)
  2. 头部GPT(榜单前列那些)也没传说中赚那么多,大部分月入也就几百美元到几千美元
  3. 真正赚到钱的反而是用GPTs做引流,把用户导到自己的SaaS或服务上

所以我现在的建议跟楼主类似:把GPT当成一个免费的获客渠道用,别指望它本身能赚多少钱。

1 个赞

@aigc_chuangzuo 你这个数据挺真实的,30万使用量+200美元,确实跟传说中"GPT Store创作者经济"差距很大。我那点流量看来再怎么优化也是杯水车薪,老老实实做工具吧。

2 个赞

楼主提到Conversation Starters,我从产品经理的角度展开聊一下,这块其实远比大多数人想得重要。

我之前在一家做ToB AI产品的公司做PM,亲自负责过一个内部GPT的launch。我们做了大概3周的A/B测试,专门测Conversation Starters的不同写法对用户留存的影响,结论很有意思:

1. 启动语决定了用户的"使用心智模型"

你写"帮我写邮件" vs “帮我写一封拒绝面试邀请的邮件,语气要礼貌”,这两种启动语吸引来的用户后续行为完全不一样。前者吸引的用户会试探性地输入各种东西(“你能干嘛?”),后者吸引的用户会直接复用模式(“那帮我写一封拒绝offer的”)。

后者的留存率在我们的测试里高了将近40%。

2. 启动语应该展示"能力上限",不是"基础功能"

很多人写Conversation Starters会写"帮我写邮件"、"帮我翻译"这种基础的,其实这样反而拉低了用户预期。更好的写法是写一个相对复杂、看起来"哇这都能做"的例子。

比如不要写"帮我写邮件",写"帮我以CTO的身份写一封解释技术债的邮件给非技术背景的CEO"。

3. 4个启动语应该覆盖不同场景,不要重复

OpenAI最多允许4个Conversation Starters,很多人会写4个相似的(都是写邮件的不同变体)。这是浪费。最好的做法是这4个分别覆盖你GPT能做的4种典型场景,让用户对能力边界有概念。

4. 用第一人称写

"帮我…"比"你能…"效果好。前者让用户感觉是自己在说话,更容易代入;后者像是在跟客服对话,反而生疏。

这个细节小,但实测有差距。

5. 启动语会被算法当作主题信号

GPT Store的搜索和推荐算法会从启动语里提取关键词作为主题信号。所以如果你想让你的GPT在某些关键词下被搜到,启动语里要自然地包含这些词。

总之,4条启动语别随便写,那是你产品的"店面橱窗"。

2 个赞

新手问题:GPTs和Assistants API到底有什么区别?我看官方文档说得有点绕。

自己研究了一下,简单说:

  • GPTs是面向C端消费者的No-code平台,你在浏览器里点点点就能搭一个,发布到GPT Store给所有人用,需要订阅Plus才能用。本质是"用别人的UI + 你的prompt和knowledge"。
  • Assistants API是给开发者的编程接口,你可以在自己的App里调用,对接自己的UI,按token计费。功能更灵活(threads、code interpreter、file search等都可以编程控制),但需要你自己写代码集成。

简单判断:你想做个让朋友们玩的工具→GPTs;你想集成到自己产品里给客户用→Assistants API。

两者底层是相通的,但定位完全不同的用户群。

1 个赞

做了十几个 GPTs 最后发现都不如写好一个提示词

OpenAPI schema那段血压也升高,nested让人崩溃

自定义 GPT 商店里 99 percent 都是垃圾 真没用