今年中期試用Midjourney後感覺繪圖效果驚人,就購買了一整年的套餐,但後來在使用中發現不是套餐的繪圖數量不夠用,而是自己沒有那麼多時間去繪圖,因為繪制的過程還是不輕松的,需要先自己策劃構思、撰寫英文提示詞、生成四幅圖片預覽、選擇放大一幅輸出,即使使用ChatGPT或者Bard來為Midjourney生成繪圖提示詞但效果也不一定如人意。
我在7月記錄的博客文章《用ChatGPT或Bard為Midjourney生成AI繪圖英文提示詞》中記錄了整個過程,後來還在留言中補充了實際在《成語典》中使用的例子,但也就是生成幾十幅後就暫停了,因為所花時間還是太多,如果還要再請人專門來做這個事情又成本增大、質量還難以保證。
但9月份DALL-E 3推出,并集成到ChatGPT Plus賬号中就不一樣了,DALL-E 3的繪圖逼真效果與Midjourney相仿,而GPT-4.0的理解能力、生成提示詞的能力與人工撰寫Midjourney中的英文提示詞相比,簡直是巨大的效率和質量提升!而且生成的圖片質量基本上一次性滿意度達到80左右,無需自己從四幅圖片中挑選、放大,這也很大節約了人工時間。
再到11月GPTs推出,就可以創建專門做某項繪圖工作的GPT,這樣确定下來步驟、要求、風格、過程等細節,不僅可以生成圖片前策劃考慮合适的提示詞,而且可以在繪圖後對圖片進行解讀,說出繪圖的策劃考慮點、圖像中的細節、滿足需求的原因等,讓人歎服!
再拿台灣繁體成語詞典的例子:綽綽有餘
不僅生成了高質量的圖片:
而且帶有這樣的解釋:
這幅圖描繪了一幅傳統的中國風景畫,主題為"綽綽有餘",即形容物品豐富、充裕的情景。畫中展現了金黃色的莊稼田野和裝滿谷物的倉庫,背景是一個甯靜的村莊和清澈的藍天,象征着繁榮和富足。
這種描繪方式與古代畫家和近代畫家的畫風相似,運用了柔和的筆觸和甯靜的色彩調色闆。畫面的一角還加上了小小的紅色印章,增添了作品的真實感和傳統美。這幅圖所描繪的豐富莊稼和充盈的倉庫恰當地體現了"綽綽有餘"這個成語的含義,即形容事物非常充足,遠遠超過了需要的程度。在中國文化中,豐收和谷物充裕常被用來象征富饒和富足,這與成語所表達的意境完美契合。通過古典中國畫的表現手法,這幅畫不僅展現了成語的字面意義,也傳達出一種古樸而深邃的感覺,呼應了中國古典文化的嚴肅性和深刻内涵。
看過解釋就更能體會到繪制出來圖像的韻味。
這已經達到可以批量使用的質量了,除了調用API的費用還有點高以外,簡直沒毛病了。
我還嘗試過生成連環畫等更複雜的繪圖,通過不斷修改提示詞,目前可以實現部分效果,但還達不到批量使用,也許再過一年半載可以生成更複雜的繪圖甚至以後可以生成故事視頻,這是終極目标。
评论