DALL-E 3 发布有一阵子了,今天跟一个朋友聊到 AI 制作漫画,我突然想起来,还没测试过 DALL-E 3 的漫画制作能力,所以简单试了试。我认为它的表现不错,做绘本类的产品应该问题不大。下面是我的作品。
Once upon a time, there is a dog, his name is Muimui
(这是我早年帮孩子写的英文演讲的作文。)
Once upon a time, there is a dog, his name is Muimui. Muimui is a corgi.
Muimui is a good dog, everything is fine except that he like barking very much.
When I cleaning the room, he barks.
When my mom and dad talk to me loudly, he barks.
One day, I was eating hot dog bread, I like hot dog bread.
Suddenly, my mom said to me: “Do you finish your homework?”, when I turn my head to her, I fall the hot dog bread down to the ground!
(这张图我尝试了很多次,都没法把说话气泡指向妈妈。)
I was shocked, and my hot dog bread fell to the floor.
Muimui run fast to the hot dog bread immediately, grabbed the bread and happily ate it.
This time, he didn’t bark at all!
简评 DALL-E
DALL-E 作为 OpenAI 的产品,它最大的优势就是可以很好的理解我们的 Prompt,不需要我们事先学习模型训练时的标记,大大降低了普通用户使用 text2img 功能的难度。Prompt 会试图把我们的 Prompt 扩写得更全面,比如第一幅图,实际生效的 Prompt 是:
Watercolor painting of Muimui the corgi looking out of a large window in a comfortable home, with curtains gently swaying.
如果我们要调整图片,可以继续跟 DALL-E 对话,它会自动帮我们整合 Prompt,然后输出新的图片。我们可以要求它基于某个图片进行修改,以便产出我们想要的效果。
如果你仔细观察,会发现上面几张图片里,有几张里面的角色存在明显的特征,比如坐在沙发上的那个小男孩,戴眼镜穿衬衣,卡其色的裤子都很接近,我不知道它是怎么做到的,不过如果能维持这个稳定性,可能真的可以用来画漫画。
我并没有尝试对角色稳定性做出约束,比如什么样的发型、什么样的衣服等,不知道会不会对输出的结果产生影响。
不过 DALL-E 也有劣势:我们不能自己训练小模型(Lora),所以大家的产出可能会千篇一律。另外 DALL-E 有很多“安全性”预设 Prompt,我们不能随意要求它画出一些 NSFW 的作品。
总结
不知道读者觉得这个作品如何?欢迎留言讨论。
欢迎吐槽,共同进步