话不多说,先看效果图
流程放下面,急着试的老哥可以直接去仓库: NyxTides/ppt-image-first: PPT image-first skill for Codex CLI
特点就几个:不用模板、个性化设计、流程自己能把控、随时可以插手改。
1.项目分析
agent会根据你的项目和需求做点分析,生成一个content_report.md,这步很快,主要就是把需求对齐一下。
2.生成预览
skill会把你的内容分成8个维度,然后挑几种最搭的风格,生成几套PPT预览图。不满意你就提要求,比如“基于C风格再弄几版”,它就重新给你来一轮,直到你点头。
3.反演
你选中喜欢的预览风格后,skill会去反推里面的风格、样式这些(因为生图有时候会有意外惊喜,你可能就喜欢它即兴发挥的部分)。反演完会跟你确认需求。
4.风格确立
这步会固定设计风格,生成风格锁和PPT分页摘要,防止后面跑偏。你确认了,就开始正式生图。
5.正式生图
你可以选每页PPT生成几张候选图。(其实大部分时候一张就够顶了,我上面展示的前两份PPT都是一次抽卡出来的)
6.挑喜欢的点复制(如果上一步只生成一份,这步自动跳过)
选你顺眼的点复制就行。
7.最终审稿
这步可以直接在界面上画线、写注释,然后点复制当前页结果或者复制按钮丢给agent。这样可以绕过PPT的写者锁,做精细化修改。
8.最终成稿
然后你就拿到一份高质量还特个性的PPT了。
核心就是靠gpt image2(别的生图模型也行,但效果可能差点),只要你接受它是图片型PPT就行。它也用图编辑的方式实现了可编辑性,可以框选、注释,模型收到后走image2的编辑接口就能定点改、局部改(具体生图和编辑方法skill里没限制,你可以用别的。我自己的实现是在本地搞了另一个skill,可以并发调生图和编辑,所有图一起出,速度很快)。
只有免费额度又想试的老哥,可以看看社区开源的网页生图额度反代项目。
NyxTides/ppt-image-first: PPT image-first skill for Codex CLI