今年中期试用Midjourney后感觉绘图效果惊人,就购买了一整年的套餐,但后来在使用中发现不是套餐的绘图数量不够用,而是自己没有那么多时间去绘图,因为绘制的过程还是不轻松的,需要先自己策划构思、撰写英文提示词、生成四幅图片预览、选择放大一幅输出,即使使用ChatGPT或者Bard来为Midjourney生成绘图提示词但效果也不一定如人意。
我在7月记录的博客文章《用ChatGPT或Bard为Midjourney生成AI绘图英文提示词》中记录了整个过程,后来还在留言中补充了实际在《成语典》中使用的例子,但也就是生成几十幅后就暂停了,因为所花时间还是太多,如果还要再请人专门来做这个事情又成本增大、质量还难以保证。
但9月份DALL-E 3推出,并集成到ChatGPT Plus账号中就不一样了,DALL-E 3的绘图逼真效果与Midjourney相仿,而GPT-4.0的理解能力、生成提示词的能力与人工撰写Midjourney中的英文提示词相比,简直是巨大的效率和质量提升!而且生成的图片质量基本上一次性满意度达到80左右,无需自己从四幅图片中挑选、放大,这也很大节约了人工时间。
再到11月GPTs推出,就可以创建专门做某项绘图工作的GPT,这样确定下来步骤、要求、风格、过程等细节,不仅可以生成图片前策划考虑合适的提示词,而且可以在绘图后对图片进行解读,说出绘图的策划考虑点、图像中的细节、满足需求的原因等,让人叹服!
再拿台湾繁体成语词典的例子:綽綽有餘
不仅生成了高质量的图片:
而且带有这样的解释:
這幅圖描繪了一幅傳統的中國風景畫,主題為"綽綽有餘",即形容物品豐富、充裕的情景。畫中展現了金黃色的莊稼田野和裝滿谷物的倉庫,背景是一個甯靜的村莊和清澈的藍天,象征着繁榮和富足。
這種描繪方式與古代畫家和近代畫家的畫風相似,運用了柔和的筆觸和甯靜的色彩調色闆。畫面的一角還加上了小小的紅色印章,增添了作品的真實感和傳統美。這幅圖所描繪的豐富莊稼和充盈的倉庫恰當地體現了"綽綽有餘"這個成語的含義,即形容事物非常充足,遠遠超過了需要的程度。在中國文化中,豐收和谷物充裕常被用來象征富饒和富足,這與成語所表達的意境完美契合。通過古典中國畫的表現手法,這幅畫不僅展現了成語的字面意義,也傳達出一種古樸而深邃的感覺,呼應了中國古典文化的嚴肅性和深刻内涵。
看过解释就更能体会到绘制出来图像的韵味。
这已经达到可以批量使用的质量了,除了调用API的费用还有点高以外,简直没毛病了。
我还尝试过生成连环画等更复杂的绘图,通过不断修改提示词,目前可以实现部分效果,但还达不到批量使用,也许再过一年半载可以生成更复杂的绘图甚至以后可以生成故事视频,这是终极目标。
评论