4 月 22 日消息,OpenAI 昨日(4 月 21 日)发布博文,宣布推出 AI 生图工具 ChatGPT Images 2.0,基于 GPT Image 2 模型打造,核心升级在于引入“思考能力”。
援引博文介绍,用户启用“思考能力”后,该 AI 生图工具可联网检索信息,依据上传文件创建视觉解析内容,并在生成前对图像结构进行推理规划。这项功能目前已向 ChatGPT Plus、Pro、Business 及 Enterprise 订阅用户开放。
在多图生成能力上,Images 2.0 实现重大突破,支持单次提示生成最多 8 张图像。关键在于,系统可在不同场景中保持角色、物体及风格的一致性。OpenAI 表示,这将大幅降低漫画页面、社交媒体系列配图及室内设计方案的创作门槛。
以上图源:OpenAI
图像质量上,新版本支持最高 2K 分辨率,宽高比范围扩展至 3:1 与 1:3,并优化像素艺术、漫画及电影剧照等风格。在多语言支持方面,该工具重点改进中文、日语、韩语、印地语及孟加拉语的文本生成能力。
参考
又要充会员?搞个生图工具还搞这么多订阅等级,麻了。
小白问一下,这个“思考能力”具体是什么意思啊?是不是它会先搜一下资料再画图?我不太确定这和以前的版本有啥区别。
这玩意儿对漫画创作可能真有用。我试了下,让它画一个侦探角色在四个不同场景破案,确实能保持人物衣服和脸型基本一致。不过背景细节有时候会乱,得手动改。
有用过的兄弟说说,那个联网搜索信息生成图片,它是怎么个流程?比如我上传一份产品说明书,它真能看懂然后画出来吗?还是说只是提取几个关键词?
又来这种帖子了,每次升级都吹得天花乱坠,什么“重大突破”、“核心升级”,结果用起来不是慢吞吞就是风格锁不住。等第一批小白鼠反馈吧,我反正不急着当冤大头。
单次生成8张图,还能保持一致性,这个挺实用的。想用它来做一套社交媒体用的主题头图试试。具体操作就是开通Plus,在GPT-4选项里找到图片生成,勾选“联网搜索和推理”,然后输入你的系列描述,记得把角色特征写清楚。
中文生成能力改进是好事,但不知道对古诗意境的还原怎么样。比如“大漠孤烟直,长河落日圆”这种,以前的模型画出来总是不对味,不是烟不对就是河不像。希望这次能好点。
哎,说起来最近显卡价格是不是又涨了?感觉AI一更新硬件就跟上,永远追不上。跑题了,但这个图生图功能看起来确实猛,就是不知道吃多少额度。