最近沉迷在ChatGPT里用DALL-E 3画各种东西,试了二十多个不同类型的prompt,来跟大家分享下我的体验。
先说大前提:DALL-E 3是直接集成在ChatGPT里的,Plus用户可以直接在对话框里描述你想要的图片,它会自动调用DALL-E来生成。这个体验上的便利性是其他AI画图工具没法比的,不用装软件不用调参数,打字就能出图。
人物类测试
我试了几个人物相关的prompt,比如"一个穿着汉服的年轻女生站在樱花树下,背景是古建筑,光影柔和"。出来的效果说实话还行,构图和色调都不错,汉服的细节也大致准确。但脸部的精细度差点意思,有时候五官比例会有点奇怪,手指数量偶尔也会出错。
又试了"赛博朋克风格的街头少年,霓虹灯下,戴着耳机",这种风格化的效果反而很好,霓虹灯的氛围感拉满了。感觉DALL-E 3对风格化、概念化的人物比写实人物表现好。
风景类测试
风景是DALL-E的强项。“日落时分的冰岛黑沙滩,火山远景,天空有极光”——出来的效果真的很惊艳,色彩过渡自然,构图也有层次感。这类图我觉得完全可以当壁纸用。
但是在需要精确地理特征的时候就不太行了。我试了"桂林漓江的实际风光",出来的山水虽然好看但明显不是漓江那种喀斯特地貌的感觉,更像是一个通用的中国山水画。
Logo设计测试
这是我最期待的部分,结果有点失望。我试了"给一家叫TechBrew的科技咖啡馆设计一个简洁的logo,扁平化风格"。出来的确实是个logo的样子,但设计感很一般,而且文字渲染乱七八糟——英文字母经常会多笔画少笔画或者拼写错误。
试了好几个logo的prompt都有类似的问题,文字部分基本不能直接用。如果只要图形部分的话勉强可以当个灵感参考。
漫画/插画风格
这个方向效果不错。"吉卜力风格的猫咪在屋顶上看星空"生成得非常漂亮,色彩和笔触都有吉卜力的感觉。"美式漫画风格的超级英雄在城市上空飞行"也很到位。
感觉DALL-E 3对各种艺术风格的理解还是不错的,只要你在prompt里明确指定风格,它大多数情况下都能抓住特征。
总结一下
优点:方便快捷、风格化效果好、风景类表现优秀、跟ChatGPT对话式交互很自然。
缺点:人物面部细节不够精细、文字渲染能力差、对特定真实地点的还原不准、logo设计实用性低。
整体感觉DALL-E 3不是最强的AI画图工具,但胜在太方便了。日常用来做个配图、找找灵感、做PPT插图是完全够的,但要做专业级别的美术创作还是得用其他工具。
2 个赞
用过Midjourney之后再看DALL-E真的会觉得差了不少。Midjourney v6在人物细节、光影质感和整体美感上明显领先,特别是写实风格的人像,MJ出来的效果有时候已经接近摄影了。
DALL-E 3的主要问题是质感不够"高级",很多图看起来有种CG渲染的塑料感。而且MJ的社区生态也更好,Discord上有大量高质量的prompt可以参考和学习。
当然MJ的缺点是需要单独付费、需要在Discord里操作,对新手不太友好。如果只是偶尔画个图DALL-E的便利性确实没话说,但对画图质量有要求的话还是推荐MJ。
1 个赞
楼上说的没错但对大多数人来说MJ的使用门槛太高了。DALL-E集成在ChatGPT里,我妈都会用,直接打字描述就行。而且可以跟ChatGPT对话式修改,说"把背景换成蓝色""人物再大一点"就能迭代,这个交互体验真的舒服。不是每个人都需要专业级画质的。
1 个赞
分享几个DALL-E 3的prompt小技巧吧,能明显提升出图质量。
第一个是尽量描述具体。不要说"一只猫",要说"一只橘色的英短猫蜷缩在窗台上,阳光从百叶窗照进来形成条纹光影,背景是模糊的书架"。细节越多DALL-E越不容易自由发挥出奇怪的东西。
第二个是指定艺术风格和参考。比如"watercolor illustration style"“in the style of Studio Ghibli”“digital art, trending on ArtStation”。DALL-E对英文的风格描述词理解得比中文好,建议关键的风格词用英文写。
第三个是用负面描述排除不想要的元素。在prompt末尾加"no text, no watermark, no frame"可以避免DALL-E自作主张加上文字和边框。
第四个是利用ChatGPT帮你优化prompt。你可以先用中文描述你想要的画面,然后让ChatGPT帮你翻译成适合DALL-E的英文prompt,它会自动补充很多专业的描述词。
最后一个,如果对某张图大体满意但想微调,可以点击图片然后选择"编辑",用自然语言描述你想改的部分就行。
2 个赞
Stable Diffusion本地跑才是正道。虽然配置门槛高点但自由度不是一个量级的,想用什么模型用什么模型,LoRA随便加,ControlNet控制构图,而且不用担心DALL-E那些内容审核限制。有个好显卡的话强烈推荐折腾一下。
2 个赞
总结下来DALL-E 3最适合的场景就是:快速出概念图、PPT配图、社交媒体配图、产品原型草图这些对精度要求不高但要快的场合。专业设计还是用MJ或者SD吧。另外DALL-E处理中文文字几乎必翻车,需要加文字的图一定要后期自己加。
3 个赞
DALL-E 出图随机性太大 20 个 prompt 至少 10 个翻车
那几个提示词技巧我试了确实有用,加具体光影描述出图质量高不少
DALL-E做PPT配图是真方便,描述一句就出图,质量够用了
做PPT配图DALL-E够用了,专业需求还是得MJ
DALL-E优势在便利性,对话式迭代是其他工具难做到的体验
MJ的Discord门槛是真高,DALL-E零门槛大众友好